统计学办法始终是在科技期刊科研原著文案中的重要部分,在科研设计和样本量估算完成的状况下,最重要的便是数据的统计学分析环节,但日前中国大都数医学期刊对统计学办法描述的需求还不足规范。现将统计学办法的描述要点作一整理,作者撰写科研原著类文案时,应遵循以下过程描述统计学办法。
1 描述统计学软件信息:首要要对正文的统计学软件加以描述,需描述软件名叫作、源自厂家和版本。常用4大软件包含SAS、STATA、SPSS软件等,还包含附带统计学功能的软件GraphPad Prism 7软件等。
2描述统计学指标:需说明科研中各描述性结果指标的暗示方式。
2.1计量资料:正态分布资料包含均值(mean),标准差(SD),标准误(SEM);非正态分布资料:中位数Median(M),四分位数间距(P75-P25)。
2.2计数资料和等级资料:重点为形成比(如4/15,比重)和百分率(如63%,频率强度)。通常用n(%)暗示,如想认识各样疾患在特定人群所占的比例,用形成比。如想认识哪一个年龄组发病率高,用百分率暗示。
2.3效应量指标:重点包含比值比(odds ratio,OR),相对危险度(Risk Ratio,RR),95%CI。如OR(95%CI)=2.6(1.3-5.2)。
3统计学分析办法:
3.1计量资料的比较
3.1.1两组比较(正态分布):
t检验:又叫作Student t检验,必须满足正态性,方差齐要求,重点包含两样本t检验(独立样本t检验,成组t检验)和配对样本t检验。
配对样本t检验的适用状况:
(1) 同一科研对象给予处理前、后比较(即自己配对);
(2) 同一受试对象接受两种区别的处理;
(3) 配对的两个受试对象分别接受两种区别的处理;
(4) 同一对象的两个部位给予区别的处理。
3.1.2多组比较(正态分布):
方差分析:两个及以上样本间均数的比较,采用成组和配伍设计,包含单原因、双原因、多原因、析因设计、重复测绘方差分析(>3个时间点数据比较)。在双原因、多原因、析因设计方差分析结果中必定要有主效应和交互效应的说明。重视,比较多组数据时,不可用t检验代替方差分析:重点原由是t检验破坏了原先的整体设计;显现假阳性错误的概率明显增多;t检验割裂了各原因之间的内在联系,没法考察交互功效是不是拥有明显性道理。应采用方差分析结合事后检验进行两两比较。
3.1.3非正态分布计量数据的非参数检验(秩和检验):两组差异比较用Mann-Whitney U检验,多组差异比较用Kruskal-Wallis H法(H-检验)。
3.2 计数资料的比较
3.2.1两组比较:行χ2检验。
n>40并且因此理论数(T)大于5,则用Pearsonχ2检验;
n>40并且因此理论数(T)大于1并且最少存在一个理论数<5,则用校正Pearsonχ2检验;
n>40或存在理论数(T)<1,则用精确(Fisher)概率法;
n<40:用精确(Fisher)概率法。
配对样本资料比较:可用配对四格表χ2检验;自己前后比较:McNemyerχ2检验。
3.2.2多组比较:行列表χ2检验。
3.3等级资料的比较:对等级资料的明显性检验采用非参数检验法。
3.3.1两组比较:成组设计资料用Wilcoxon两样本比较法,配对设计资料用符号秩和检验法。
3.3.2多组比较:成组设计用Kruskal-Wallis H法(H-检验)、Ridit法;多个样本两两比较用Nemenyi法;配伍组设计用Friedman秩和检验法。
3.4 关联和回归分析
3.4.1关联性分析:先作散点图,确定有线性趋势方可进行关联性分析。线性关联:Pearson关联性分析(正态分布);秩关联:Spearman关联性分析(非正态分布,等级资料)
3.4.2线性回归:包含因变量(结果)、自变量(原因) 和连续变量,数据需符合正态分布。简单线性回归:1个因变量,1自变量;多重线性回归:1个因变量,多个自变量。
3.4.3 Logistics回归:包含因变量(结果)和自变量(原因)。要求Logistics回归(配对,病例对照数据),非要求Logistics回归(成组数据)。其中非要求Logistics回归包含2种,二元Logistic回归:指的是因变量为二归类变量(是,否;患病,未患病)的回归分析;多元Logistic回归:指的是因变量为有序或无序归类变量(轻、中、重;高中、低;优、良、中、差;A,B,C,D)的回归分析。
3.4.4 Cox回归:包含因变量(结果)和自变量(原因),多用于存活分析。危害函数比(hazard ratio,HR):是存活分析资料中用于估计由于某种原因的存在而使死亡/缓解/复发等危害改变的倍数。
3.4.5纳入回归模型的变量选取:单原因分析后,应当思虑应该将那些自变量纳入回归模型进行多原因分析?通常状况下,意见纳入的变量有:
(1)单原因分析差异有明显性道理的变量(此时,最好将P值放宽有些,例如0.1或0.15等,避免漏掉有些重要原因);
(2)单原因分析时,无发掘差异有明显性道理,然则临床上认为与因变量关系密切的自变量。
4 统计学办法描述举例:
4.1数据描述:①实验采用SPSS 22.0软件(美国IBM机构)和SAS 9.2软件(美国SAS Institute Inc.机构)进行分析。②统计分析时先检测各科研中心完成例数、病例的脱落状况,而后进行两组病人入选时的人口统计学及基线各相关特征的分析,考察实验组和对照组之间的可比性。③计量资料采用均数、标准差、中位数、最小值和最大值、上下四分位数进行统计描述,计数资料采用例数和百分比进行统计描述。
4.2统计分析办法:①实验中各随访时间点两组间L2-4、股骨颈、Ward’s三角区骨密度值较基线的差值、血清钙、甲状旁腺素、骨钙素、白细胞介素十、白细胞介素6、肿瘤坏死因子α和胰岛素样生长因子1水平比较采用两样本t检验(数据正态分布)或Mann-Whitney U检验(数据非正态分布)。②组内各时间点以上数据比较采用重复测绘方差分析及LSD检验比较。③两组不良反应出现率的比较采用Pearson χ2检验。④各组骨密度值指标、骨质疏松指标及炎性因子指标间的关联性分析采用Pearson关联分析法(数据正态分布)或Spearman关联分析法(数据非正态分布)。⑤检验水准(双侧)α = 0.05。
|