期刊检索
下载专区
位置:首页 >> 写作技巧
 

医学论文中的一些常见的统计学问题

一项科研能否取得有价值的成果,一篇论文学术水平的高低,很大程度上得取决于实验设计的水平。周密的科研设计是科学实验过程的依据,对实验数据进行合理的统计学处理是提高科研质量的必要手段。随着现代科学的发展,特别是医学统计学、生物医学工程学和电子计算机在医学科研中的应用,广大临床工作者越来越有必要更多地熟悉一些数理统计知识,以便获得可靠的资料,从而得出正确的结论。全国不少医学期刊,从七十年代以来对这个问题日益引起广泛注意。为了让临床医务工作者在科研和写作、评阅论文中,对实验设计与数据统计问题引起足够重视,笔者近几年来学习国内医学、生物学期刊中见到的一些统计学问题,略加讨论。

  一、临床疗效观察的实验设计问题  在各种医学期刊中,半数以上是疗效观察方面的论著。现择其较普遍存在的统计学问题,结合实验设计基本原则加以讨论。

  (一)对照与均衡性测定  国内医学期刊有关临床疗效观察的文章甚多,不少杂志刊登了一些事先未设计对照的文章,其结论难以令人信服。如《用柴葛解肌汤治疗上呼吸感染》一文,报道治愈好转率为97.7%,因无对照,无法断定其效果如何,因此,治愈好转率中含有假像。  对照的方法虽有多种,但对照的基本原则是与实验组齐同可比,最好作均衡性测定。

  (二)安慰剂与盲法试验  安慰剂与盲法试验是医研(主要是比较性研究)中常用的科研方法,结果准确、误差性小。安慰剂在形、量、色、味等要与实验药物一样,不能给受试者和执行者任何暗示。这种试验就是双盲法试验。但近年来,尚有人用改良的双盲法,此法分两期:第一期(公开期)试验有效者留,无效者弃。有效者进入第二期(双盲试验),以确定疗效是否系安慰剂的作用。在预防效果观察时可采用该法,临床上应用诸多困难,应视具体情况而定。

  (三)样本含量与重复原则  没有足够样本的研究结果,是经不起重复试验的,有的论文凭少数病例观实的结果下结论,是不慎重的。如《重症肺炎并发DIC29例》一文,作者观察脑型患者3例,其中死亡一例,就得出"一般脑型病死率高达57%,本组脑型病死率较低,看来及早用肝素阻断DIC过程,对降低脑型病死率可能具有重要意义"的结论。因无对照,结论不可靠。

  (四)随机分组与实验设计类型  随机化分组即每个实验对象有同等机会被抽样(分配)到各组去,而不受任何系统因素的影响。常用的实验设计类型有完全随机设计、自身对照设计、交义设计、配偶设计、随机区组设计、拉丁方设计、正文(析因)设计、序贯设计、半数效量实验设计(动物试验),回顾性与前赡性调查研究设计等。科研设计时应根据研究目的要求选择不同类型的实验设计方法,进行相应的统计处理。

  (五)诊断与疗效标准--指标设计问题  观察对象应确诊无疑,事先要制订好诊断标准,保证样本的真实性与代表性。疗效判断要有科学的指标,有特异性和定量指标更好。研究记录表格扣记录要完整统一,仪器、试有等要核校,人员要相对稳定,操作及观察方法要严格执行统一标准。

 二、统计指标与统计处理方法要合理运用  在各种医学期刊论文中,对统计学处理与统计指标的合理运用问题,已比过去有所重视,但尚存在不少问题。

  (一)均数与标准差、标准误的合理运用问题  在医学论文中运用均数(表示各变量值平均水平与集中趋势)、标准差(表示变量值个体问离散情况与程度)和标准误(表示样本群体间差异程度,衡量抽样误差大小)的地方是很常见的,而达到合理运用尚存在一些问题。例如,在比较两样本统计量时只考虑平均水平(均值),而忽视了离散情况(标准差)和抽样误差(标准误);在正常值研究时,如资料近似正态分布,应当用均值加减K倍标准差(X±KS)来确定95%的正常值范围(K根据样本大小查K值表而定),应当标明标准误,而错用了标准差等。如《正常小儿三种不同剂量及正常成人50微克PHA皮试反应强度研究》一文中写道:"正常值范围为均值±2×标准误".井写道:"小儿50微克组:均值±2×标准误=2.01~18.1毫米".显然是错误地把标准误当成标准差用作估计正常值了。

  (二)正常值研究中的几个问题  临床正常值确定方法依资料频数分布类型而定,主要有两种:一是均值加减标准差法适用于近似正态分布资料,二是百分位数法,适用任意分布资料。此外,角度资料(如脑血流图、心电图等的角度数据)运用圆形分布法,Poisson分布资料用Poisson分布法,正偏态分布资料用对数正态分布法等来处理。现今全国发表的一些医学论文中,正常值方面的问题也较多。引一些实例加以研究。  如在《迁延性、慢性肝炎患者植物血凝素皮试应用价值的探讨》一文中写道:"正常人甲组156人…平均值±标准误为15.4±0.4mm(平均值上标准差为15.4±5.6mm)。"那么,正常值是角标准误与标准差咖个统钎量来计算的呢?是加减1倍还是2倍标准差(或标准误)呢?作者均来说明。  又如《正常儿童尿游离α氨基酸氮的测定》一文,对1~13岁(分四个年龄组)125名正常儿进行研究,在正常值研究设计及分析时存在三个问题:(1)样本含量不足:如不同性别、不同年龄组的测定值仅据15人的结果而定正常值,显然是不妥的。作者针对各组结果矛盾现象,在讨论中两八提到"可能因例数太少,不能切实反映客观规律的缘故。"若按不同性别、年龄组确定正常值,一般要求每组100~12O人方能悦明问题。(2)错把标准误当作标准差用作估计正常值范围:文中说:"1~13岁正常儿童的游离α氮基酸氮/总氮%的均值可信限为:1.30±3×0.036,即1.19~1.41".这里将标准误0.036当作标准差用作估计正常值了。正确的应是:"游离α氨基酸氮×l00/总氮%的95%正常值范围为1.30±2×0.4=0.~2.3.这里0.4是标准差。正常值范围在正态分布资料时,如考虑到样本大小及把握度,最好表达为单侧:+KS或-KS;双侧±KS.式中K值表(见周达生:医学问答,中华儿科杂志(4):245,1980)。(3)按性别、年龄组制订正常值问题:当研究对象有多个年龄组时,两组均数间比较用t检验,多组均数间比较可用F-Q检验,若差异显著,则需按不同性别、年龄组分别制订正常值。

  (三)联系与因果  在临床实验研究中,经某种处理(如治疗)后受试对象出现某种反应(如治愈),并不能肯定是因果关系。有时比较两变量之间关系时,虽明显相关,但也不能断言其间有因果关系,只能说有一定统计联系(苏德隆:联系与因果。中华预防医学杂志13:106,1979)。在医学论文中甚至有不作相关回归分析就胃然下类似结论的。要了解有无因果关系,有时可进一步作回归分析(当然因果可表现为回归关系,但呈回归关系不一定是因果关系)。

  (四)多组多级小值频数处理问题  在临床及动物实验研究中常遇到多组多级(R×C表)小值频数的比较,论文中大多忽视此类数据的合理统计处理,主要问题有:(1)未加适当统计处理,不考虑抽样误差而凭表面数字差别就轻易下结论。(2)处理方法不恰当。对此类数据可采用超几何概率计算法(见周达生:医学科研中乡组小值频数统计处理方法探讨。中华预防医学杂志(4):211,1980)、薛仲三氏X3检验公式(见薛仲三,医学统计方法和原理。366页,人民卫生出版社,北京1978)和秩和检验与等级指数法(黄镇南:等级型资料的三种统计分析方法,湖南医学院,长沙,1980)等。

(五)零反应的统计处理  两组计数比较,若一组有零反应,即出现0%或100%情况时,可用零反应公式处理。  如《病毒性肝炎中医辩证与机体免疫状态的初步探讨》一文,作者对19例迁延件肝炎中医辨证与淋转测定结果作了分析(原文表3)。由于作者对数据未作处理而下结论,不少信息失落,有些矛盾现象难以解释。原表3中有三处出现有零反应,宜分割后列出三个四格表,用零反应检验法处理。本例为双侧检验,差异显著性水平定力0.25和0.005.从三个四格表分析结果看,仅气虚与阴虚淋转测定值之间差异显著(P<0.005),而正不虚与气虚和阴虚问差异均不显著(P>0.025)。从而提示在虚证中还要区别对待,只有气虚者免疫功能才显著地低下。这样可使文中矛盾现象找到合理解释。

  (六)相对数比较与标准化法  比较两个总的频率指标时,若两组或多组对象内部构成存在差别且足以影响结论时,可应用率的标准化法加以校正。该法是在某种统一标准构成条件下进行率的对比的方法。如不同地区的某病死率、患病率、发病率,不同医院某病的病死率、治愈率、病床周转率等相互比较,最好标准化后,才能正确地对比其率的高低。

 

中国生育健康杂志》编辑部 
地址:北京市海淀区学院路38号北京大学医学部科研中心楼107 
邮政编码:100191  电话&传真:010-82802942