- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析的方法综述
主成分分析的方法综述
摘 要:主成分分析是一种非常有效的数据分析处理的技术,具有非常广泛的应用前景。本文首先概述了主成分分析方法,然后介绍了PCA的定义、模型、算法及选取主成分个数的标准,对PCA技术的优势和缺陷分别进行了剖析和总结,对PCA在评价排序、特征提取、模式识别、图像处理、图像分类和图像压缩等领域的实际应用进行了讨论,对主成分分析方法的发展趋势和应用前景做了展望。
关键词:主成分分析;PCA模型;特征提取;图像处理
中图分类号:TP391 文献标识码:A
文章编号:2096-1472(2016)-06-01-03
Abstract:PCA(Principal Component Analysis)is an effective data analysis technique with a bright future of extensive application.The paper summarizes PCA in the first place,and then introduces its definition,data model,algorithm and the standards to determine the number of selected principal components.Moreover,the paper analyzes and summarizes the advantages and disadvantages of the PCA technique,and discusses its practical application in different fields,like evaluation and sorting,feature extraction,patter recognition,image processing,image classification and image compression.Finally,the paper makes expectation about the development trend and application prospect.
Keywords:PCA;PCA model;feature extraction;image processing
1 引言(Introduction)
PCA(Principal Component Analysis),主成分分析,是一种数据分析的技术,主要思想是将高维数据投影到较低维空间,提取多元事物的主要因素,揭示其本质特征。主成分分析的应用范围非常广泛,经常和分类、聚类,以及与其他方法连用进行数据处理。它可以高效地找出数据中的主要部分,将原有的复杂数据降维,去除整个数据中的噪音和冗余。
PCA是一种统计分析方法,它将原来众多具有一定相关性的多个指标,重新组合成一组新的互相无关的综合指标[1]。它是一种最小均方意义上的最优变换,目的是去除输入随机向量之间的相关性,突出原始数据中的隐含特性[2]。PCA方法的优势在于数据压缩以及对多维数据进行降维,它操作简单,且没有参数限制,可以方便的应用于各个场合。它经常被用于人脸识别和图像压缩、特征提取等领域,是在高维数据中寻找模式的一种技术[3]。
2 主成分分析方法(Principal component analysis )
2.1 主成分分析方法的目标
由于原始数据的变量基数比较复杂,难以描述其特征,主成分分析提出了一种简单解决问题的思想,从事物的主要方面进行重点分析。该方法认为某个事物的特征集中在几个主要变量上,只需要将这几个变量分离出来,对这几个变量进行重点分析,用它们的线性组合表示事物的主要特征。因此,主成分分析方法的目标就是寻找x(xn)个新变量,用这x个变量反映事物的主要特征,实现对原始数据矩阵规模的压缩。这x个新变量就是“主成分”,用它们反映原来n个变量的特征,并且这x个变量之间是互不相关的。通过主成分分析实现数据维数的压缩,将多元数据特征在低维空间中反映出来[3]。
2.2 PCA模型
PCA是一种正交变换,利用二阶的统计信息进行计算。它强调数据之间的相似和不同,是一种在高维数据中寻找模式的技术[2]。对于原始数据,我们可以通过一些变换来提取数据间的内在特征,其中一种方法就是通过线性变换去实现[4]。这个过程可以表示为:
这里是一个变换值,可以把它当作基本的变换矩阵,通过此变换来提取原始数据的特征。令为表示环境的维随机向量。假设均值为零,即:
令表示为维单位向量,在其上投影。这个投影被定义为向量和的内积,表示为:
原创力文档


文档评论(0)