第六讲,主成分分析详解.pptVIP

  • 17
  • 0
  • 约3.89千字
  • 约 35页
  • 2016-03-25 发布于湖北
  • 举报
主成分分析 主成分分析 (Principal Component Analysis PCA) 主成分分析 主成分分析是对多变量数据进行统计处理的一种数据线性投影方法,它在尽可能保留原有信息的基础上将高维空间中的样本映射到较低维的主成分空间。其基本思路是以一种最优化方法浓缩量测数据信息,使数据矩阵简化,降低维数,寻找少数几个由原始变量线性组合的主成分,以揭示数据结构特征,提取基本信息。 该法具有变差最优性、信息损失最小性、相关最优性、回归最优性等特点。 主成分分析的概念 主成分分析的中心目的是将数据降维,以排除众多化学信息共相存相互重叠的信息。它是将原变量进行转换,使少数几个新变量是原变量的线性组合,同时,这些变量要尽可能多地表征原变量的数据结构特征而不丢失信息,新变量互不相关,即正交。 文献中有许多种叫法:本征矢量投影、奇异值分解、karhunen loeve展开、和K-L投影 主成分分析的基本原理 在二维空间有一组测试点(y1i,y2i)(i=1,2,…,n),如下图,这组数据在二维平面上分布大致为椭圆形,若似将二维降为一维,实际上就是将二维空间上的点投影到一维空间中的一条线上。 主成分分析的基本原理 主成分分析的基本原理 在一维空间中的这条线必须包含原数据的最大方差。更准确些说,沿着这条线,使方差达到最大,其它方向使方差达到最小。从代数学的观点看,这些点的分布可以表达成它们

文档评论(0)

1亿VIP精品文档

相关文档