- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
国内图书分类号:TM301.2 学校代码:10213
国际图书分类号:62-5 密级:公开
工工工学学学博博博士士士学学学位位位论论论文文文
高维数据的多视图聚类方法研究
博士研究生:陈小军
导 师:徐晓飞教授
副 导 师:黄哲学教授
申 请 学 位:工学博士
学 科:计算机应用技术
所 在 单 位:深圳研究生院
答 辩 日 期:2011 年10 月
授予学位单位:哈尔滨工业大学
Classified Index: TM301.2
U.D.C.: 62-5
Dissertation for the Doctoral Degree in Engineering
Research on Multi-view Clustering for
High-dimensional Data
Candidate: Chen Xiaojun
Supervisor: Prof. Xu Xiaofei
Co Supervisor: Prof. Joshua Zhexue Huang
Academic Degree Applied for: Doctor of Engineering
Specialty: Computer Applied Technology
Affiliation: Shenzhen Graduate School
Date of Defence: October, 2011
Degree-Conferring-Institution: Harbin Institute of Technology
摘 要
摘 要
当前实际应用产生的数据维度越来越高,受维度效应的影响,许多在低维
数据上表现良好的聚类方法运用在高维数据上时无法获得好的聚类效果。在过
去十几年,高维数据的聚类方法是聚类分析的主要研究方向,众多国内外研究
人员已经取得了不少研究成果,如子空间聚类、主题模型等。
最近高维数据的多视图特性引起了研究人员的注意。多视图特性是指许多
高维的特征可以自然分为若干特征组,特征组中的特征具有语义相关性。传统
的聚类方法将多个视图视作一个整体进行处理,忽略了视图内部的信息及视图
之间的差异。近几年,研究人员提出了一些多视图聚类算法来解决上述问题。
但现有多视图聚类研究存在如方法少、算法复杂度高、忽略视图关联关系及只
能处理多视图结构已知的高维数据等缺点。
本文在现有研究工作的基础上,针对高维数据多视图聚类存在的几个问
题,结合软子空间聚类及主题模型最新研究成果,提出了一系列新颖的高维数
据多视图聚类方法。主要研究工作和创新包括:
1. 将传统的特征加权扩展为双层特征加权,提出了一个多视图双层特征自
动加权聚类方法TW-k-means 。该算法同时对视图及单个特征进行自动加
权,可以有效地识别紧凑的视图及重要的特征。同时该算法具有与标准
的k-means一样的算法复杂度,适合处理大数据。该方法的提出为变量加
权聚类方法开辟了一条新的道路。
2. 将传统的子空间加权扩展为双层子空间加权,提出了一个多视图双层子
空间自动加
文档评论(0)