PCA与KPCA简介.docxVIP

  • 13
  • 0
  • 约 10页
  • 2018-06-07 发布于重庆
  • 举报
PCA与KPCA简介

第二章 主成分分析 第二章 主成分分析 1. 主成分分析的基本原理 统计学上PCA的定义为用几个较少的综合指标来代替原来较多的指标,而这些较少的综合指标既能尽多地反映原来较多指标的有用信息,且相互之间又是无关的。作为一种建立在统计最优原则基础上的分析方法,主成分分析具有较长的发展历史。在1901年,Pearson首先将变换引入生物学领域,并重新对线性回归进行了分析,得出了变换的一种新形式。Hotelling于1933年则将其与心理测验学领域联系起来,把离散变量转变为无关联系数。在概率论理论建立的同时,主成分分析又单独出现,由Karhunen于1947年提出,随后Loeve于1963年将其归纳总结。因此,主成分分析也被称为K-L变换[1]。 PCA运算就是一种确定一个坐标系统的直交变换,在这个新的坐标系统下,变换数据点的方差沿新的坐标轴得到了最大化。这些坐标轴经常被称为是主成分。PCA运算是一个利用了数据集的统计性质的特征空间变换,这种变换在无损或很少损失了数据集的信息的情况下降低了数据集的维数。 PCA的基本原理如下:给定输入数据矩阵 (通常),它由一些中心化的样本数据构成,其中且 (2-1) PCA通过式(2-2)将输入数据矢量变换为新的矢量 (2-2)

文档评论(0)

1亿VIP精品文档

相关文档