烟草代谢组学-多元统计分析分析.pptVIP

  • 117
  • 0
  • 约2.74千字
  • 约 41页
  • 2016-06-13 发布于湖北
  • 举报
多元统计分析 孔宏伟 2012-12-26 组学技术---丰富的数据信息 变量样本量 多变量之间可能存在相关性 数据结构复杂:噪声、背景、差异巨大的信号 数据处理 单因素分析 多元统计分析处理的是多变量(多指标)问题。由于变量较多,增加了分析问题的复杂性。但在实际问题中,变量之间可能存在一定的相关性,因此,多变量中可能存在信息的重叠。人们自然希望通过克服相关性、重叠性,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,这实际上是一种“降维”的思想。 多元统计分析的数据对象 多元数据统计分析的研究内容 1. 简化数据结构(降维问题) 2.聚类与判别(归类问题) 3.变量间的相互联系(回归问题) 降维-主成分分析 主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。 较少的几个综合指标—主成分(原变量的线性组合)尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的 主成分的确定 主成分投影 得分(score) 载荷(loading) 特征值(Eigenvalue)-主成分方差的平方 R2X DModX 主成分个数的确定方法: 特征值1(2) 累加特征85% 特征值拐点 Cross-validation 子集模型 Scaling 我们感兴趣的不是变量的绝对值,而是样本间的

文档评论(0)

1亿VIP精品文档

相关文档