代谢组学数据分析的统计学方法.pdfVIP

  • 655
  • 0
  • 约3.21万字
  • 约 4页
  • 2017-05-13 发布于天津
  • 举报
代谢组学数据分析的统计学方法.pdf

中 2014 4 31 2 期 3·57 · 国卫生统计 年 月第 卷第 代谢组学数据分析的统计学方法* 柯朝甫1 张 涛2 武晓岩1 李 康1Δ , (4 ) : 代谢组学是近年发展快速的一门学科 目前在医 相互作用关系复杂 各种代谢物质可能不仅 、 、 、 、 , , 学 植物学 微生物学 毒理学 药物研发等诸多领域中 具有简单的相加效应 而且可能具有交互作用 从而增 [1-5] 得到了广泛的应用 。代谢组学研究产生大量的数 加了识别这些具有复杂关系的生物标志物的难度。 , 、 、 。 (5) : , 据 这些数据具有高维 小样本 高噪声等复杂特征 相关性和冗余性 各种代谢物并非独立存在 , , 、 如何从复杂的代谢组学数据中提取出有价值的信息 而是相互之间具有不同程度的相关性 同时由于碎片 筛选出潜在的生物标志物成为近年来代谢组学研究的 加合物和同位素的存在使得数据结构存在很大的冗余 。 , , 热点和难点 据此 本文针对目前代谢组学数据分析 性 这就需要采用合理的统计分析策略来揭示隐藏其 中的常用统计学方法及其研究进展进行介绍。 中的复杂数据关系。 (6) : 分布的不规则和稀疏性 代谢组学数据分布 代谢组学数据的特点 , ( ), 不规则 而且数据具有稀疏性 即有很多值为零 因 代谢组学是系统生物学领域中继基因组学和蛋白 , 。 此 传统的一些线性和参数分析方法此时可能失效 , 质组学之后新近发展起来的一门学科 它通过检测生 数据的预处理 物体在受到外源刺激或基因修饰后其体内代谢物质的 [6] 变化来探索整个生物体的代谢机制 。其研究对象 代谢组学数据分析的目的是希望从中挖掘出生物 ( < , , , 为生物体内所有内源性小分子代谢物 分子量 相关信息 然而 代谢组学数据的变异来源很多 不仅 1000Da), , 。 研究手段为高通量检测技术和数据处理方

文档评论(0)

1亿VIP精品文档

相关文档