组织样品分类中因分类能力分析的统计方法研究.pdfVIP

  • 5
  • 0
  • 约9.5万字
  • 约 55页
  • 2016-03-24 发布于贵州
  • 举报

组织样品分类中因分类能力分析的统计方法研究.pdf

组织样品分类中因分类能力分析的统计方法研究

组织样品分类中基因分类能力分析的统计方法研究 中文摘要 目的: 本课题深入探讨从大量的基因中筛选具备分类能力的基因变量并应用于样 品分类的统计学方法,并对各种方法进行分析比较和评价。 方法: 对现有的急性白斑病基因芯片数据资料采用多种统计学方法进行分析,筛 选具有较强分类能力的基因变量,并利用这些基因变量建立判别函数式,以指 导新样品的分类。对应用的结果进行分析比较,从方法学的角度进行评价。 结果: 1.在O.005的显著性水准下,分段逐步判别分析法筛选出56.-.80个左右具 有分类能力的基因变量,筛选出的基因变量在两类中的均数差别有统计学意义 (P0.05)。 t2.百分位数法和邻近分析法筛选出相关系数最大的前55个基因变量有较 高的分类能力,邻近分析法确定的分类指标界限为,’卸.22左右,但从分析的可 行性角度考虑,选择,.≥O.5,筛选到893个基因变量。这些筛选出来的基因变 量在两类中的均数差剐也都是有统计学意义的(po.05)。 3.用分段逐步判别分析法筛选出的基因变量建立判别函数式,回顾性考核 结果显示全都正确分类,前瞻性考核结果显示有部分AML病侈薯被错分到ALL 类中。用百分位数法和邻近分析法筛选出的基因变量建立判别函数式,回顾性 考核结果也显示全部正确分类,前赡性考核结果显示随着基因变量数量的逐渐 减少,错分率逐渐增大,但都保持在O.2以下。 4.将预测强度法应用于分段逐步判别筛选出的基因变量时,出现错分率 很高的情况,说明该方法可能并不适用予采用分段逐步判别筛选的变量。当将 其应用于百分位数法和邻近分析法筛选出的变量时。前瞻性考核的结果都比较 好,仅错分1~2例,锗分率都在O.1以下。 结论: 利用百分位数法和邻近分析法可以筛选出分类能力较强的基因变量,并能 结台后续的预溯强度法对筛选出的基因变量进行分类能力的分析。将这些方法 应用于大量基因变量的筛选和分类能力研究,计算量与计算复杂度都不高,不 需要对变量进行分割以降低维度,在这一点上预测强度法明显优于经典的判别 分析方法。其预测分类的可靠性可以用只譬值来评价,也比较有说服力。 关键词: 基因芯片 判剐分析 基因筛选 统计方法 白血病 2 Researchesonthe StatisticalMethodsabout the of Ability Gene Classificationto ClassifySamples ABS’I’l【AC’l’ To Objective andevaluatethestatisticmethods in deeplyexplore the applied damofhumanacuteleukemiacases.These micrommy statisticmcthodsare focus嘶 the selection gene fromthe databaseand the large inclass applyillgcap

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档