- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
代号 10701 学号 0922121538
分类密级公开
TP301.6
题(中、英文)目 基于聚类分析的标签传播半监督学习研究 Research on Label Propagation of Semi-supervisedBased on Clustering
韩玉想杨利英副教授作者姓名指导教师姓名、职称计算机应 用技术
工学
学科门类 学科、专业提交论文日期 二?一二年五月
西安电子科技大学
学位论文创新性声明
秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文 是我个人在导师指导下
进行的研究工作及取得的研究成果。尽我所知,除了文中特别加 以标注和致谢中所罗列的内
容以外,论文中不包含其他人已经发表或撰写过的研究成果;也 不包含为获得西安电子科技
大学或其它教育机构的学位或证书而使用过的材料。与我一同工
作的同志对本研究所做的任 何贡献均已在论文中做了明确的说明并表示了谢意。
申请学位论文与资料若有不实之处,本人承担一切相关责任。
木人签名: 日期
西安电子科技大学
关于论文使用授权的说明
本人完全了解西安电子科技大学有关保留和使用学位论文的规 定,即:研究生在校攻读
学位期间论文工作的知识产权单位属西安电子科技大学。本人保 证毕业离校后,发表论文或
使用论文工作成果时署名单位仍然为西安电子科技大学。学校有 权保留送交论文的复印件,
允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可 以允许釆用影印、缩印或其
它复制手段保存论文。(保密的论文在解密后遵守此规定) 本学位论文属于保密,在—年解密后适用本授权书。
本人签名: 日期
导师签名: 日期 摘要]摘要
半监督学习是机器学习的一个重要分支,在近些年互联网爆炸式 发展过程中,
岀现了大量的数据分类需求,半监督学习可以利用有限的已标记 数据和大量的未
标记数据来解决数据分类的问题,有效缓解了目前获得大量未标
记数据容易而获
得大量已标记数据困难的窘困,因此受到了国际机器学习领域的 高度关注。作为
半监督学习一种主流方法,基于图的半监督学习成为新的研究热 点O
本文着重研究基于图的半监督中的标签传播算法,分析并优化了
标签传播算
法。为了使聚集成簇的数据间标签传播较快,并避免把处于决策
边界附近的同类
已标记样本分割到不同的类中,我们提出了基于聚类分析的图构
造预处理方法,
通过增加属于同一聚类数据点之间边的权重,提高分布密集数据
之间的关联,减
小它们在标签传播中被划分为不同类的概率。同时,针对标签传
播扩散速度较慢
和距离已标记数据较远处数据点分类模糊性较大的问题,提出基 于自训练框架的
学习方式,在标签传播过程中把未标记数据中置信度较高的那部 分数据加入到已
标记数据集中,增加标签传播的数据源,提高分类准确率。
本文在UCI数据集上进行了实验研究,实验验证了所提算法的
有效性和优越
性。实验结果表明,基于聚类分析的标签传播在一般情况下优于 经典标签传播方
法,当已标记数据接近分类边界时优越性尤为明显。自训练标签 传播方法与经典
标签传播方法比较,速度和准确率都有提高。
关键词:半监督学习 标签传播 聚类 自训练Abstract 3Abstract
Scmi-supcrviscd learning is an important branch of machinc learning, with the
explosion of internet in recent years, there is a great amount of data analysis demandSemi-supervised learning can utilize limited labeled data and a large number of
unlabeled data to solve data classification problem? Therefore researchers of machine
learning pay intense attention to this field of research? As a popular method of
semi-supervised learning, graph-based semi-supervised learning has been a new hot
spot of researchIn this paper, we concentrate on graph-based semi-supervised 1 earning, analyzing
and optimizing label propagation algorithm? In order to
solve the accur
您可能关注的文档
- 基于高职院校学生职业核心能力培养课程教学.docx
- 基于高职院校瑜伽教学几点思索.docx
- 基于高职院校主导校企协同创新模式探究.docx
- 基于高紫杉醇质量分数的东北红豆杉优良种源选育.docx
- 基于隔代教育质化探究报告.docx
- 基于股价服从对数正态分布凯利投资策略.docx
- 基于顾客满意度提升的人力资源外包服务企业发展策略研究.docx
- 基于顾客体验与顾客共创价值策略研究.docx
- 基于顾客需求物流企业质量管理探究.docx
- 基于顾客忠诚的旅游景区顾客关系营销策略研究.docx
- 2026年智能交通信号报告及未来五至十年车路协同报告.docx
- 2026年新能源汽车电池技术分析报告及未来五至十年动力系统革新报告.docx
- 2026年智慧医疗影像设备分析报告及未来五至十年行业应用报告.docx
- 2026年智能机器人行业分析报告及未来五至十年自动化生产报告.docx
- 2026年自动驾驶测试场地建设报告及未来五至十年法规完善报告.docx
- 2026年光伏发电产业报告及未来五至十年光伏市场报告.docx
- 2026年数字货币金融创新报告及未来五至十年电子支付报告.docx
- 2026年风力发电效率报告及未来五至十年装机容量报告.docx
- 2026年石油化工精细化工产品研发报告及未来五至十年新材料报告.docx
- 2026年智慧农业物联网监测报告及未来五至十年农业现代化报告.docx
原创力文档


文档评论(0)