剩下500字

统计分析一点通 丨认识两组独立样本t检验(1)

发布日期:2018-11-17来源:SIFIC感染循证资讯发布人:陈小晓

SIFIC科研设计与统计分析


作者:医统家园和SIFIC循证团队


「循证感控」(Evidence based infection prevention and control,  EBIPC)含义丰富,工作中心基于证据(Evidence)。不仅仅在于证据的援引,更重要的价值在于努力寻找证据,发现证据,传播证据。然而,怎么才能科学的找到“证据”,并科学解读呢?科研设计和统计分析的重要性不言而喻。而这恰恰是感控相关工作人员甚至于对相当一部分临床工作者都是不小的困惑。


SIFIC循证与医统家园合作,共同推出「SIFIC科研设计与统计分析」专栏,通过案例分析和解读,为大家系统介绍和科普科研设计和统计分析基础知识、剖析精品文章中的科研设计技巧和统计知识等。大家也可以通过公众号、SIFIC论坛等一系列途径,咨询科研设计和统计分析困惑



今天,由贝塔,来给大家带来第一课,t检验的基本原理。



数据实例



最近有个老铁甩了我一组数据,说让我做个t检验,我问他怎么知道t检验,他微微一笑:“两组间的定量资料比较不就是t检验么”。嘿,老铁还不错,知道点基本知识。下面我们先看一下他的那组数据是什么样子的。


1.jpg


数据分析



数据指标为IgG,数据分两组,没有一一对应关系,分析两组间IgG是否存在差异。咋一看,没毛病,连续性变量的两独立样本组间比较,用t检验。可是贝塔多了个心眼,IgG是一个生化指标,而我们很多的生化指标,包括ALT、RBC等等都是常见的偏态分布指标。于是做了个直方图,果然是偏态分布,而且呈“L”状,直方图显示了均数、标准差和观察例数。


2.jpg



遇到这种情况怎么办呢?



一般来说,临床检查的很多指标,原始状态下都是偏态分布的,但是像这种偏态,我们通常可以通过一定的转化,将其转化成正态或者近似正态分布。那么我们把IgG进行对数转换一下,转换完以后发现还是有稍许偏态的样子,但整体已经完全看不出“L”形来了,我们认为这样的可以算为是近似正态。

好,下面贝塔就可以开始做t检验了。


3.jpg


两组独立样本t检验注意事项



下面,贝塔来详细和大家介绍一下两组独立样本t检验相关注意事项:


从书本上,我们都知道了,两组独立样本t检验需要注意三点:

①独立性,②正态性,③方差齐性。这三点如何解读呢?


①独立性:其实要检验样本间的独立性十分复杂,所以一般都是根据样本的性质来判断。如果涉及到遗传性、传染性的疾病,需要注意样本中有没有一个家庭等因素,而常规来说,我们认为一般的调查样本,个体间都是独立的,换句话来说,这个条件一般只在特定条件下才会被考虑;


②正态性:这个条件是被考虑的最多的,也是经常会遇到的问题。


那么正态性怎么去判断呢?


常用的就是下面三种:


a)看图凭感觉。画直方图,根据直方图判断是不是正态;


b)参考文献。根据一些参考文献既往对该指标的描述,来判断是不是正态分布;


c)正态性检验。这是一个定量的指标,判断正态分布是杠杠滴,但也有一定的缺陷,因为单纯根据其计算出来的 值,有时候也不准,过于严格。t检验其实对正态性具有一定的稳健性,即使资料稍稍偏离正态分布,对结果的影响也不是很大,仍然可以使用,如果偏离较大(比如先前没有对数变换的时候,呈“L”型),尤其是样本量还不是很大的时候,则不太适合。


所以,贝塔对于一些血常规、生化指标等常用的是a法,画图目测观察,而像年龄等,根据参考文献法,一般默认为正态分布,不再多加考虑;


③方差齐性:两样本间需要考虑方差齐性,但在实际的使用中,也较少会特异去做这方面的检验,在SPSS中做t检验时自带方差齐性检验。


4.jpg


以上就是使用两组独立样本t检验的条件。



总结一下



不是所有的连续性变量,都能做t检验。

进行t检验之前,特别要注意验证数据的正态性和方差齐性。

部分偏态数据,可以通过一定的转化,达到满足“态性”或者“近似正态”的需求。


在得到最后的p值时,尚需注意,如果p值接近α时,即接近0.05时,下结论需要特别慎重,这类属于边缘阳性或者边缘阴性,很有可能会因为外界条件稍许的改变而得到完全不一样的结论。