剩下500字

统计分析一点通 丨认识两组独立样本t检验(2)

发布日期:2018-11-17来源:SIFIC感染循证资讯发布人:陈小晓

SIFIC科研设计与统计分析


作者:医统家园和SIFIC循证团队


「循证感控」(Evidence based infection prevention and control,  EBIPC)含义丰富,工作中心基于证据(Evidence)。不仅仅在于证据的援引,更重要的价值在于努力寻找证据,发现证据,传播证据。然而,怎么才能科学的找到“证据”,并科学解读呢?科研设计和统计分析的重要性不言而喻。而这恰恰是感控相关工作人员甚至于对相当一部分临床工作者都是不小的困惑。


SIFIC循证与医统家园合作,共同推出「SIFIC科研设计与统计分析」专栏,通过案例分析和解读,为大家系统介绍和科普科研设计和统计分析基础知识、剖析精品文章中的科研设计技巧和统计知识等。大家也可以通过公众号、SIFIC论坛等一系列途径,咨询科研设计和统计分析困惑



上一节中我们通过对数据的判断,并进行对数转换后,认为可以使用两组独立样本t检验,那么整个过程怎么做呢,接下来请跟着贝塔一步一步从数据走到结果。


数据整理


将数据录入SPSS,在录入数据时,通常是将一个个体的变量放在一行上,即一行表示一个人,一列表示一个指标。如本例的第一行,表示“ 第2组的第1个样本,为980”


1.jpg



正态性检验


判断其是否是正态分布(严格来说,我们是需要分组看,各组需要分别符合正态分布)


2.png

3.jpg


得到的结果是:


4.png


这样我们就可以目测这样这个数据严重偏态分布,呈L型。

于是我们考虑对数变换:


5.png

6.jpg


按顺序操作完这5步以后,就可以得到下图,在数据中新建一列ln_IgG,这个变量就是对数转化后的IgG,可以直接对这个变量进行分析。


7.png


对数转化后,再用上述直方图方法,发现近似正态。


8.png


此时,有人会说,这也太离奇了,目测在统计分析这么严肃的话题中,可靠么?


检验正态性还有一个方法,就是“正态分布检验”。那么我们尝试对变换出的新数据,做一下正态分布检验,看看p值是否小于0.05。


9.png

10.jpg

11.png


一步一步操作下来,最后结果如下,哎呦,p<0.05,这是不符合正态性啊,看来和我们目测的结果还是有不一样的,这怎么办?


12.png


而在实际的分析过程中,贝塔依然根据直方图来选择t检验,因为t检验对正态分布的稳健性,类似这样的偏态分布其实稳健性依然比较好。此外,前面做正态性分布是我们选择了“带检验的正态图”,即Q-Q图,如下图,散点与标准线越靠近,则越趋向正态分布,只是这个图也没有具体参数,依旧是目测,属于可视化的评估参数。


13.png


还有另一种常用初步判断是否符合正态性的办法,那就是根据均数和标准差,一般认为均数<3倍标准差时,不应该是正态分布(存在负值的不在此列)。


敲黑板了,很多文章中出现类似“97.8±161.4”这样的描述,会被一眼看出数据分布情况,故而有些会被审稿人要求对数据进行转换或者使用非参数检验(后续中会进行讲解)。当然,如果你还是纠结于这个数据的正态性,那么可以选用非参数检验,这样属于一了百了,万无一失,缺点是降低了检验效能。


两独立样本的t检验


好,贝塔判断完正态性后,就进入t检验正题了。


首先提出检验假设:

H0:μ1=μ2

H1:μ1≠μ2

设定的检验水准为0.05;

.

14.png

15.png


然后根据以上操作,我们的t检验的结果终于出现了


16.png


我们发现结果还分了几个区域,前半部分是判断方差齐性,如果方差齐,那就用上面一排的检验结果,如果方差不齐,那就用下面一行的检验结果。


呀呀呀呀,贝塔历经千辛万苦,终于得到了最终检验结果啦,结果为0.187,故按α=0.05 水准,尚不能认为两组间的IgG有差异。


总结一下


  1. 数据录入后,首先检验数据的正态性。如为偏态分布,通过适当转换,变成近似正态分布。

  2. 检验数据正态性有两种方法,一是使用直方图,二是用SPSS的正态分布检验,当两者结果有矛盾时,可参考直方图的结果,也可结合Q-Q图的可视化结果来判断。

  3. t检验结果自带方差齐性,根据根据方差的情况,选择p值。


在你眼中So easy的两组独立样本间的t检验,居然还有如此多的小九九,你学会了么?