基于聚类分析的标签传播半监督学习的研究.doc

基于聚类分析的标签传播半监督学习的研究.doc

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
代号 10701 学号 0922121538 分类 密级 公开 TP301.6 题(中、英文)目 基于聚类分析的标签传播半监督学习研究Research on Label Propagation of Semi-supervisedBased on Clustering 韩玉想 杨利英 副教授作者姓名 指导教师姓名、职称计算机应用技术 工学 学科门类 学科、专业提交论文日期 二?一二年五月 西安电子科技大学 学位论文创新性声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下 进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内 容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技 大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:_____________日期_____________ 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读 学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕业离校后,发表论文或 使用论文工作成果时署名单位仍然为西安电子科技大学。学校有权保留送交论文的复印件, 允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其 它复制手段保存论文。(保密的论文在解密后遵守此规定) 本学位论文属于保密,在 ___ 年解密后适用本授权书。 本人签名:_____________ 日期_____________ 导师签名:_____________ 日期_____________摘要 1摘要 半监督学习是机器学习的一个重要分支,在近些年互联网爆炸式发展过程中, 出现了大量的数据分类需求,半监督学习可以利用有限的已标记数据和大量的未 标记数据来解决数据分类的问题,有效缓解了目前获得大量未标记数据容易而获 得大量已标记数据困难的窘困,因此受到了国际机器学习领域的高度关注。作为 半监督学习一种主流方法,基于图的半监督学习成为新的研究热点。 本文着重研究基于图的半监督中的标签传播算法,分析并优化了标签传播算 法。为了使聚集成簇的数据间标签传播较快,并避免把处于决策边界附近的同类 已标记样本分割到不同的类中,我们提出了基于聚类分析的图构造预处理方法, 通过增加属于同一聚类数据点之间边的权重,提高分布密集数据之间的关联,减 小它们在标签传播中被划分为不同类的概率。同时,针对标签传播扩散速度较慢 和距离已标记数据较远处数据点分类模糊性较大的问题,提出基于自训练框架的 学习方式,在标签传播过程中把未标记数据中置信度较高的那部分数据加入到已 标记数据集中,增加标签传播的数据源,提高分类准确率。 本文在 UCI 数据集上进行了实验研究,实验验证了所提算法的有效性和优越 性。实验结果表明,基于聚类分析的标签传播在一般情况下优于经典标签传播方 法,当已标记数据接近分类边界时优越性尤为明显。自训练标签传播方法与经典 标签传播方法比较,速度和准确率都有提高。 关键词:半监督学习 标签传播 聚类 自训练 Abstract 3Abstract Semi-supervised learning is an important branch of machine learning, with the explosion of internet in recent years, there is a great amount of data analysis demandSemi-supervised learning can utilize limited labeled data and a large number of unlabeled data to solve data classification problem. Therefore researchers of machine learning pay intense attention to this field of research. As a popular method of semi-supervised learning, graph-based semi-supervised learning has been a new hot spot of researchIn this paper, we concentrate on graph-based

文档评论(0)

zhuliyan1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档