剩下500字

统计一点通丨卡方检验应用实例解析(一)

发布日期:2018-11-17来源:SIFIC感染循证资讯发布人:陈小晓

SIFIC科研设计与统计分析


作者:医统家园和SIFIC循证团队


「循证感控」(Evidence based infection prevention and control,  EBIPC)含义丰富,工作中心基于证据(Evidence)。不仅仅在于证据的援引,更重要的价值在于努力寻找证据,发现证据,传播证据。然而,怎么才能科学的找到“证据”,并科学解读呢?科研设计和统计分析的重要性不言而喻。而这恰恰是感控相关工作人员甚至于对相当一部分临床工作者都是不小的困惑。


SIFIC循证与“医统家园”合作,共同推出「SIFIC科研设计与统计分析」专栏,通过案例分析和解读,为大家系统介绍和科普科研设计和统计分析基础知识、剖析精品文章中的科研设计技巧和统计知识等。大家也可以通过公众号、SIFIC论坛等一系列途径,咨询科研设计和统计分析困惑。



上一节,贝塔与大家共同学习了t检验的基本用法,今天给大家带来的是工作中应用更广泛的卡方检验,主要用于无序分类数据的统计分析,如不同组间率的比较和构成比的比较。



实例介绍



在医学研究中,我们常需要对两组、多组率或构成比进行比较:如两种治疗方法的有效率、不同地区某种疾病的发病率、人群构成是否相同等。这类问题在统计上属于假设检验的范畴。其所涉及的数据类型为无序分类数据


例如:研究者随机抽取河水引用区377人,泉水饮用区301人,采用X光拍片进行大骨节病的诊断。两类地区的大骨结病检出情况见表1。研究者关心的问题是:河水饮用地区与泉水饮用地区大骨节的检出率是否相同?


表 1 不同地区的大骨节并检出情况

1.jpg



分析思路



由表1数据不难计算出河水饮用区的检出率为19.89%,泉水引用区的检出率为32.9%,两者之差为12.01%,但能不能下结论说大骨节病的发病率(分布情况)在两地间存在差别呢? 


不能。这一结果只是一次抽样得到的样本统计量的差别。这个差别,有可能是由随机误差导致(两组总体发病率相同),也有可能两地区间的发病率存在本质区别(两地总体发病率不同),泉水组的总体检出率真的较高。这仅从观测的样本数据无法判断,而需借助样本信息对其所代表的总体进行推断。 

如果更进一步将这一实际问题转化为统计问题,则其问题实质是考察某无序分类变量各水平在两组或多组间的分布是否一致。所用到的统计方法是卡方检验。


卡方检验的历史悠久,英国著名统计学家Karl Pearson于1900年首次提出,而后得以广泛应用,可应用之广可泛媲美连续型变量均值比较的t检验。是对无序分类数据进统计推断的重要方法(但其应用不止于此)。其基本原理是通过二维列联表的期望频数和实际频数构建卡方统计量,并利用卡方统计量所服从的卡方分布进行统计推断。



实际操作



下面我们来演示如何使用SPSS对表 1数据进行卡方检验。



第一步:输入数据



将表1的数据按照图1形式输入SPSS。数据共三列四行,第一、第二列为不同地区检测结果的组合,第三列为地区与检出结果组合下的频数值。


2.jpg

图1 数据格式




第二步:数据加权


对数据进行加权,权重为计数列。此步骤目的是使SPSS能够识别地区和检出情况各类别组合下的频数数据。操作步骤见图2、图3。


3.jpg

图2 数据加权


4.jpg

图3 使用计数变量进行加权



第三步:卡方检验



点击Analyze-Descriptive Statistics-Crosstabs(图4),将地区作为行变量、检出情况作为列变量(图5)。点击cells,勾选Row(图6),以计算行频数百分比(即检出率)。点击statistics勾选Chi-squqre以计算卡方统计量(图7)。这些设置完毕后,点击Crsosstabs界面的OK按钮,软件即可完成计算。


5.jpg

图4 


6.jpg

图5


7.jpg

图6

   

8.jpg

图7



结果判读及解释


输出主要结果分为两部分,第一部分是交叉表(图8-1),列出两个地区的检出、未检出频数以及检出率、未检出率以及合计值等指标。第二部分则为卡方检验的结果,第一行显示的为卡方检验相关信息,从左至右数值含义分别为皮尔逊卡方值、自由度、以及相应P值。P值是进行统计推断的依据,由图2可见P<0.001。因此,根据卡方检验结果可以认为河水饮水区与泉水饮水地区的大骨节病检出率差别具有统计学意义,且泉水引用区的检出率较高。


9.jpg

图8-1


10.jpg

图8-2


本文介绍了卡方检验的在2*2四格表资料中的应用,相信通过上文的介绍,大家已经可通过SPSS进行卡方检验并解释其结果。在下一篇文章中,我们将进一步以实例结合SPSS操作剖析卡方检验:介绍其应用条件及应用条件不满足时的处理方法。


数据来源:卫生统计学第八版,人民卫生出版社