- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
非线性成分分析作为一个核的特征值问题.doc
非线性成分分析作为一个核的特征值问题
摘要
我们用于一种新方法描述如何执行主成分分析非线性形式。通过对积分算子核函数的使用。通过一些相关的非线性映射输入空间,我们可以有效计算在高维特征空间的主成分组成部分;比如在16 *16的图像空间中所有可能的5个像素的乘积。这篇论文中我们给出了该方法的推导,连同由非线性与内核的方法形成的讨论,并且展现目前对模式识别的非线性特征提取的第一批实验结果。
1 引入
主成分分析是尽可能提取高维数据集的一种强大的配套技术.它很容易通过求解一个特征值问题或者用迭代算法来估计主成分;现有的文献(看Jolliffe(1986) and Diamataras Kung (1996))。PCA是将我们所描述的数据的坐标系进行正交变换。用新的坐标值所表示的数据我们称为主成分。通常情况下,少数的主成分组足以说明数据的主要结构。这些少数的数据我们有时候叫做数据的因素及潜在变量。
目前的主成分分析的推广工作,我们输入空间中的变量或特征,Aizerman,Braverman,和 Rozonoer,1964;Boser,GuyonVapnik,1992)。尽管这个方法已被广泛的认知(Burges,1996),它的对机器学习的用途不是很大,除了在支持向量机方面。(Vapnik,1995)
在这篇论文中,我们给出了通过这种方法构造非线性函数的几个例子。第一个例子是主成分分析的非线性形式,我们将会给出方法的细节及实验结果(第2到4节),我们也将主要描绘出具体的算法(第7节)。
在下一节中,我们首先回顾一下标准PCA的算法。为了能把它推广到非线性情况下,我们将用对应的唯一的点积的方法将PCA算法公式化。在第3节中,我们将在特征空间中通过计算点积来讨论核方法。这两节主要是第4节的基础,第4节将提出对于非线性的PCA得核的基本算法。第5节中将讨论基本核PCA算法与其他推广的PCA算法的不同。在第6节中,我们将给出在模式识别的特征值提取中的核基本算法的一些第一次实验结果。然后在第7节将探讨关于核方法在其他领域的应用,将在第8节中对于探讨给出总结。最后,一些技术性的材料,对于论据不构成主要的线索我们将放入附录中。
2 特种空间的PCA
给出一组以M为中心的观测值
PCA算法对角化后的协方差矩阵为
(1)
为了做这个,首先解决特征值问题
(2)
对于特征值和且,对于V的值必须依赖于的跨度,因此,(2)就等价于
(3)
本节的其余部分是专门用来直接转换到非线性情况,为了在本论文中提出的方法做基础准备。我们应该现在就描述在空间F上的另一种点集的计算方法,它通过一个可能的非线性映射将输入空间映射到F空间
(4)
F所代表的就是特征空间,维数可能非常的大,很可能是无限的。
这里和下面的大写字母代表空间F中的元素而小写字母表示中的元素。
接下来,我们做一个假设,我们将数据中心化,也就是说
然后我们将返回数据点。用空间F的协方差矩阵
(5)
_______
更精确地说,这个协方差矩阵也被定义为的期望;为了方便,我们应该通过一个有限的例子用同样的公式计算协方差矩阵来估计下(1)的极大似然率
(如果F是无限维的空间,我们认为通过映射到
将作为线性算子,我们必须找到个特征值以及 个特征向量
满足
(6)
和上面的讨论同理,V的解法也依赖于的跨度。对于我们,我们得到了两个有用过的结论:第一个我们得到下面的等价不等式
(7)
第二,存在系数有
(8)
结合(7)式和(8)式,我们得
(9)
定义一个矩阵K
(10)
这就写成
(11)
其中记为用通过作为向量的列。因为K是对称矩阵,它有一组可以长成整个空间的特征向量组成,即
(12)
给出方程式(11)的所有的解法。我们记K为半正定的,它就相当于
(13)
您可能关注的文档
最近下载
- 汽轮机排汽焓计算方法及系统.pdf VIP
- RBA内部审核计划签到表检查表总结报告及问题点跟进报告.pdf VIP
- 2025年浙江省中考英语试卷(含答案).docx
- 政治仪式视角下中国阅兵的功能与价值阐释.docx
- 四法一纲题目及答案.doc VIP
- 专题1.5等腰三角形(高效培优讲义)数学苏科版2024八年级上册.docx
- 一种小卫星电源系统的能量平衡分析方法.pdf VIP
- 地下供水管网非开挖修复用塑料管道系统第1部分_总则.pptx VIP
- SY∕T 7300-2016 陆上石油天然气开采含油污泥处理处置及污染控制技术规范.docx VIP
- 药店动态质量管理知识(一)答案-2025年执业药师继续教育.docx VIP
文档评论(0)