- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于测地线距离的广义高斯型Laplacian特征映射及
∗
其集成判别算法
1,2 1 1 1
曾宪华 罗四维 王娇 赵嘉莉
1 北京交通大学计算机与信息技术学院,北京 100044
2 西华师范大学计算机学院,四川,637002
Email:xianhuazeng@
摘 要:传统的 Laplacian 特征映射是基于欧氏距离的近邻数据点的保持,近邻的高维
数据点映射到内在低维空间后仍为近邻点, 高维数据点的近邻选取最终将影响全局低维坐
标。本文将测地线距离和广义高斯函数融合到传统的 Laplacian 特征映射算法中,首先提出
了一种基于测地线距离的广义高斯型Laplacian 特征映射算法(GGLE ),该算法在用不同
的广义高斯函数度量高维数据点间的相似度时,获得的全局低维坐标呈现出不同的聚类特
性;然后,利用这种特性,进一步提出了它的集成判别算法,该集成判别算法的主要优点
是:近邻参数 K 固定,邻接图和测地线距离矩阵都只构造一次。在木纹数据集上的识别实
验表明这是一种有效的基于流形的集成判别算法。
关键词:流形学习; Laplacian 特征映射; 广义高斯函数; 测地线距离; 集成;
中图法分类号 TP181
1 引言
流形学习是一个具有基础性和前瞻性的研究方向,由于其有着广阔的应用前景,近年来
已成为机器学习、模式识别、数据挖掘等领域的研究热点之一,涌现出一批参数少、运算快、
易求全局最优解的非线性流形学习算法,如等距映射算法(Isometrical Mapping, ISOMAP)[1]、
Laplacian 特征映射算法(Laplacian Eigenmap,LE)[2]、局部切空间排列算法(Local Tangent
Space Alignment, LTSA)[3]、局部线性嵌入算法(Locally Linear Embedding, LLE) [4]等。这些算
法都要通过构造邻接图来表示高维数据的局部几何结构,然后在不同假设条件下确定数据点
之间的某种关系(如 ISOMAP 是估计数据点之间的测地线距离,LE 是近邻数据点之间的相
似度,LTSA 是将每个数据点的邻域数据点投影到局部切空间上并寻求局部切坐标整合到全
局坐标的仿射变换关系,LLE 是寻找每个近邻点和它的近邻数据点之间的线性组合关系),
利用这些不同关系构造全局低维坐标。它们都面临一个共同的问题是选择近邻构造邻接图,
近邻选取最终将影响全局低维坐标。詹德川和周志华提出集成 ISOMAP 的流形学习算法[17],
该算法通过选择多个近邻参数 K ,对每一个K 值都运行 ISOMAP 获取低维坐标,然后将这
些低维坐标加权平均得到最终低维坐标。张军平等人提出基于集成的判别流形学习算法[7],
每一个近邻参数运行 ULLELDA[8]产生独立的子空间集合,独立学习分类器,获得了较好的
集成分类结果。这两种算法都要多次选择近邻参数,多次构造邻接矩阵,集成 ISOMAP 要
多次计算测地距离矩阵,集成 ULLELDA 却要多次构造重建矩阵,也就是这两种集成流形
学习在取得好的效果的同时时间消耗也很大。
传统的 Laplacian 特征映射是基于欧氏距离 K 近邻或ε邻域的近邻数据点的保持,近邻
的高维数据点映射到内在低维空间后仍为近邻点[2] [5] [6] 。那么,多大程度的近邻点以及多少
数量的近邻点应该在低维空间需要保持呢?不同数量的近邻点需要保持时,Laplacian 特征
映射需要重新计算邻接图构造邻接权矩阵。同时,对于位于嵌入在高维空间中的低维流形上
的数据点来说,如若增加近邻点的数量,仍然用欧氏距离来度量近
文档评论(0)