- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多流形数据的结构分析研究.doc
多流形数据的结构分析研究
摘要:在大数据的时代,面对着大量的多流形数据,对多流形数据的结构分析进行研究是十分有必要的。为了提高对多流形数据的分析能力,在已有的聚类技术基础上,结合流形学习的方法和谱聚类的方法,发展出了谱多流形聚类方法。而在研究多流形数据的结构以及谱多流形聚类的基础上,又提出了稀疏谱聚类方法来进一步改进对多流形数据的结构分析研究。
关键词:多流形数据;数据几何结构分析;谱聚类;谱多流形聚类;稀疏谱多流形聚类
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)09-0003-03
Research on Structure Analysis of Multi-Manifold Data
HAN Yang
(College of Electronics and Information Engineering, Tongji University, Shanghai 201804, china)
Abstract: In the era of big data, it is very necessary to study the structure analysis method of multi-manifold data, facing a large number of multi-manifold data. To improve the analysis ability of the multi-manifold data, the spectral manifold clustering method is developed, which based on the existing clustering techniques and combined with manifold learning method and spectral clustering method. On the basis of studying the structure of multi manifold data and the clustering of spectral manifold, the sparse spectral clustering method is proposed to improve the structure analysis of multi manifold data.
Key words: multi-manifold data;data geometry structural analysis;spectral clustering;spectral clustering on multiple manifolds; sparse spectral clustering on multiple manifolds
1 概述
现今,我们已经进入了大数据的时代。在这个技术飞速进步,信息爆炸的时代,数据的量从K到M,从M到G,从G到T,从T到P……。随着数据量的迅速增加,对分析方法的需求也有了进一步的增加。而在对数据的分析中,一个重要的方向是将数据集中属于不同集合的数据分开,这也就是所谓的聚类分析[1]。传统的聚类方法,例如,K均值聚类,即通过比较所有点到每个类的中心距离与重置类中心的方法,已经不能够满足解决许多问题的实际需求。
在对实际问题的分析中,可以发现,有许多的数据集,实质上是由多个几何结构组合而成。几何结构分析已被广泛应用于对象识别、图像分类等模式识别和分类问题。同时,对于高维数据的相关性分析、聚类分析等的基本问题而言,基于结构的分析也非常重要。而流形,在数学中就是用于描述几何结构的,并且为研究各种维度下曲线、曲面的可微性提供了最一般的抽象[2,3]。流形的微观结构使得它能够容纳微分结构,从而可以用局部线性去近似它;而它的宏观结构却又使得它可以作为对抗局部扰动的理想数学模型。因此,对多流形数据的结构分析进行研究是十分有必要的。
2 背景介绍
对于多流形数据,其中不存在交叠混合的情况相对而言比较少,而且由于不相交的情况相对比较简单,用传统的聚类方法即可解决,本文不再过多讨论。实际中存在困难的,是多流形交叠混合的情况。在现实环境中,尤其是机器视觉中,大量存在需要对多流形数据进行识别的问题。现在的流形学习算法能处理的情况还比较弱,而前提假设的条件比较强,特别是对于不同维数的多流形混合的问题,目前还没有完全解决的方法。而此又恰恰是模式识别中一个合理且常见的情况。虽然针对多流形交叠混合的非线性学习已经存在许多成熟的模型,如ISOMAP、谱聚类(SC)等等,但都有各自缺陷[4-7
您可能关注的文档
- 基于纹理和草图的图像铅笔画绘制.doc
- 基于纹理特性与空域相关的高效视频编码帧内分级快速算法.doc
- 基于经济学视角的超级明星现象研究综述.doc
- 基于经济联系度的襄阳市城市空间扩展方向分析.doc
- 基于结构张量的视频超分辨率算法.doc
- 基于结构方程探究大学生外语学习效能的影响因素.doc
- 基于网络安全关键技术的研究.doc
- 基于网络平台的高校学生管理服务创新.doc
- 基于网络环境下的高校档案管理系统信息安全问题分析.doc
- 基于网络环境的大学计算机课程实验教学改革.doc
- 专题04 天气与气候(期末真题汇编,广东专用)(解析版).docx
- 专题04 中国的经济发展(百题精选)(期末真题汇编)(原卷版).docx
- 专题05 建设美丽中国(专项训练)(原卷版).docx
- 专题05 建设美丽中国(专项训练)(解析版).docx
- 专题05 居民与文化 发展与合作(百题精选)(期末真题汇编)(解析版).docx
- 2024年下半年教师资格考试中学《教育知识与能力》真题(含答案和解析).docx
- 专题05 居民与文化 发展与合作(百题精选)(期末真题汇编)(原卷版).docx
- 专题05 居民与文化 发展与合作(期末真题汇编,广东专用)(解析版).docx
- 专题05 居民与文化 发展与合作(期末真题汇编,广东专用)(原卷版).docx
- 统编版七年级语文上册课件《雨的四季》.pptx
原创力文档


文档评论(0)