统计分析过程的常见七宗罪,你可曾犯其中几条?
原创 郑老师 医学论文与统计分析 2020-12-30
随着统计教育的普及,对于科研工作者来说,统计分析看起来慢慢变得不再是问题了,统计描述、t检验、方差分析,乃至多重比较、卡方检验貌似都可以通过SPSS统计软件分析快速形成。但统计分析有一些问题还是容易犯错,有些是原则性的问题、有些则是小细节问题,我列举基本统计研究的几个问题,称之为七宗罪。
1、项目与论文研究设计,没有考虑样本量的计算
之所以把这个问题摆在第一位,是因为这个问题基本上十之八九就没有很好考虑,无论是一个项目的申报书、还是一个毕业论文的开题、一篇论文分析,均没有考虑好样本量的多少?经常采用30、40、60例这样齐整的样本量,怎么来得?自己想想的。更不要说动物试验了!其实动物试验也需要估算样本量,不能因为动物不值钱,动物也有伦理的!
比如有下文,没有样本量计算方法,怎么设定60例呢?为什么就是60例呢?即便60例足够,也不严谨!
2、所有定量数据,统计描述都用均数±标准差
你见过什么时候中文的学术论文,定量数据采用中位数和四分位数描述了?太少太少了!大家都喜欢用均数±标准差。但你没有考虑,均数能否代表着这一堆数据吗?你没有发现有些时候标准差远远大于均数?有时候数据有好一些异常值?固定思维模式要改改了,很多时候中位数和四分位数间距反而能够更好体现数据的特征。
一般情况下,判断数据是不是正态分布的简易方法是,当指标只能取正值或只能取负值时,“标准差接近或大于均值时数据不是正态分布成立”。
一旦出现现象,就不能用均数±标准差了,否则论文发表会被审稿人发现。
比如下文,用均数±标准差,显然不合适。
3、所有定量数据的比较,都采用t检验
早些年这一现象非常普遍,现在随着统计思维的普及,很多人知道了偏态数据差异性比较时候采用非参数秩和检验来代替。但总的来说,基本上采用t检验来进行两组定量数据的差异性比较仍然是固定思维?如果没有你数据分析之前没有考虑数据正态性的问题,没有考虑两组数据方差是否相似,那么就容易犯错。再次强调:严重偏态分布的数据用秩和!秩和!秩和!
4、无论什么样的分类数据的比较,一直都是卡方检验
卡方检验是用来毕竟不同组数据之间率或者构成比有无统计学差异。没有错,率的比较是采用卡方。但有没有考虑过你的卡方条件是否符合呢?当样本量较小,或者某一行或者一列数据太少的时候,卡方检验不好使用,应该是用Fisher!这里说一下,建议以后少用卡方,多用Fisher,因为Fisher才是最准确的!哪一种场景下都没有错!
比如:下列表格,属于样本量较少的情况,应该用FIsher确切概率法又比如:试验组和对照组的癌症特征比较,也应该用Fisher确切概率法
这里强力建议: 多分类数据差异性比较,Fisher确切概率法才是首选,不要过于依赖卡方检验
5、方差分析多重比较,用t检验
这宗罪早些年很多,如今已经被死死遏制在较低的犯罪水平,凡事讲到方差分析都要提到,两两比较不要用t检验!你现在还犯错?那不应该呀!两两比较要采用类似于LSD, Bonfferoni、tukey、SNK的方法,推荐使用Bonfferoni方法,相对保守的一种方法。
6、P值小于0.05,被认为有显著性差异,P值小于0.01,被认为有极其显著性差异
P<0.05英文名字是statistical significance 没有错,但是由于显著性差异给人带来误导(感觉组别与组被之间的差异很大),现在医学研究不再强调显著性差异,P<0.01更不能说差异极其显著。无论 P<0.05还是P<0.01,只能说,差异具有统计学意义或者具有统计学差异。
比如下文,其统计文字描述是不妥当的
又例如,当比较甲、乙两种药物的疗效时(假定甲药优于乙药),若得到“P<0.001”,则认为甲药极显著地优于乙药;若得到“P<0.01”,则认为甲药非常显著地优于乙药;若得到“P<0.05”,则认为甲药显著地优于乙药。
7、没有遵循随机化、对照、重复原则评价处理因素的作用
无论是t检验、卡方、秩和、方差分析的分析结果,其结论是否可靠均需要严谨的设计。只有在随机化设计、合理均衡对照、一定样本量的基础上,通过假设检验的方法得到的结果,才能够被认为是处理因素发挥作用。而随意分组、自身前后配对研究、甚至空白对照,都没法证明处理因素的作用。观察性研究比如调查研究,差异性的统计分析方法更说明不了什么问题,只能说组与组有差别!
例如:这是一项回顾性队列研究,所有180病例为医院手足口病的住院患者。按患者是否应用中药治疗分为常规治疗组(对照组)与中药治疗组(治疗组)。比较中、西医治疗的效果。结果方面,两组患者的有效情况采用卡方检验,差异有统计学意义(P<0.01),该论文认为中医药治疗效果较好。显然这样的结论不妥当,不够严谨。
好了,基本统计方法,你犯了几宗罪?
2021年5月20日