基于半监督SVM的非平衡学习-电子与通信工程专业论文.docxVIP

基于半监督SVM的非平衡学习-电子与通信工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
107TN82学校代码 分 类 107 TN82 10701 T P1 8 学 号 1202121308 密 级 公开 西安电子科技大学 硕士学位论文 基于半监督 SVM的非平衡学习 作者姓名 : 领 域 : 学位类别 : 程伟 电子与通信工程 工程硕士 王爽学校导师姓名、职称: 企业导师姓名、职称: 王爽 王爽 教授 凤宏晓 高工 提交日期: 2014 年 12 月 A Research on Imbalanced Learning Based on Semi-supervised SVM A thesis submitted to XIDIAN UNIVERSITY in partial fulfillment of the requirements for the degree of Master in Electronics and Communication Engineering By Cheng Wei Supervisor: Wang Shuang Feng Hongxiao December 2014 西安电子科技大学 学位论文独创性(或创新性)声明 秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在 导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标 注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成 果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示了谢意。 学位论文若有不实之处,本人承担一切法律责任。 本人签名: 日 期: 西安电子科技大学 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属于西安电子科技大学。学校有权 保留送交论文的复印件,允许查阅、借阅论文;学校可以公布论文的全部或部分 内容,允许采用影印、缩印或其它复制手段保存论文。同时本人保证,获得学位 后结合学位论文研究成果撰写的文章,署名单位为西安电子科技大学。 保密的学位论文在 年解密后适用本授权书。 本人签名: 导师签名: 日 期: 日 期: 摘要 摘要 摘要 随着网络系统、信息安全等领域的快速发展,大规模数据呈现爆炸性的快速 增长。虽然现有的机器学习方法已经得到了广泛的应用,但是不平衡数据的分析 研究仍然是目前面临的挑战之一。非平衡学习旨在提高算法对不平衡数据分类时 的性能。由于不平衡数据集复杂的分布特征,因此我们需要引入新的原理、算法 和工具解决非平衡学习问题。在标记样本不足的情况下,半监督学习 (Semi-supervised Learning)通过引入未标记样本提高算法的性能,因此是目前研 究的热点之一。本文主要针对不平衡数据进行分析研究,并结合半监督 SVM 算法 提出新的策略。 1. 本章主要针对 SVM 算法在处理非平衡率较高的数据集时,性能严重下滑 的问题进行分析。通过结合 Granular SVM 的框架和欠采样的策略,提出了基于重 复欠采样的 Granular SVM 非平衡学习算法。选取非平衡学习评价准则 G-means 对 训练出的模型进行评价,采用最优的模型对测试数据进行分类。该方法在不同非 平衡率的数据集上取得了不错的效果。 2. 在标记样本很少的情况下,半监督 SVM 算法对不平衡数据集的分类效果 依然很差。通过把“信息粒”的策略引入半监督 SVM 中,构造多个差异性大的分 类器。同时结合集成学习的思想,引入聚类的评价指标对未标记样本的置信度进 行判定,提出基于 Granular S3VM 的集成学习算法。该算法有效解决了半监督 SVM 不适用于处理不平衡数据的问题。 3. 通过对非平衡学习的基本采样方法进行对比,提出基于不同采样方法的 Granular S3VM 非平衡学习算法。主要针对不平衡数据集的分布特征,利用基本的 采样方法对数据集进行一定的再平衡处理,有利于提高未标记样本的分类准确率。 实验证明算法在不同数据集上,分类效果有不同程度的提升。 本文工作得到了国家自然科学基金(No.、新世纪优秀人才支持计 划(No. 66ZY110)和陕西省科学技术研究发展计划项目(No. 2013KJXX-64)资 助。 关 键 词: 不平衡数据分类, 半监督 SVM, Granular S3VM, 集成学习 论文类型 :应用基础技术 I ABSTRACT ABSTRACT 西安电子科技大学硕士学位论文 西安电子科技大学硕士学位论文 PAGE PAGE III IV IV ABSTRAC

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档