分类中的类重叠问题及其处理方法研究-管理科学学报.PDF

分类中的类重叠问题及其处理方法研究-管理科学学报.PDF

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
16 4 Vol. 16 No. 4 第 卷第 期 管 理 科 学 学 报 2013 4 JOURNAL OF MANAGEMENT SCIENCES IN CHINA Apr. 2013 年 月 分类中的类重叠问题及其处理方法研究① 1 ,2 2 2 2 , , , 熊海涛 吴俊杰 刘洪甫 刘 鲁 (1. , 100048 ; 北京工商大学计算机与信息工程学院 北京 2 . , 100 191) 北京航空航天大学经济管理学院 北京 : . 摘要 类重叠 问题是数据挖掘与机器学习领域的瓶颈 问题之一 如果其中还存在类不均衡 问 , . , 题 时 情况变得更加复杂 有鉴 于此 本文在 已有文献基础上 归纳了三种类重叠学习算法及提 : , , 出一种新的方法 分隔法 并首次将 支持向量数据描述算法用于 实际数据的重叠样本识别 对 类重叠 问题及其与类不均衡 问题的相互影响进行 了系统研究. 在真实数据上采用五种分类器 : 1) “ ” ; 2) 的实验结果表明 多数情况下 分隔法 是表现最佳 的类重叠学习算法 分隔 法通常对基 ; 3) , 于分界 面而非规则的分类器更为有效 分隔 法在类不均衡 问题中表现很好 当基础分类器 为支持向量机 时尤为突出. 最后针对 支持向量机的 实验结果给 出了理论分析. : ; ; ; ; 关键词 数据挖掘 分类 类重叠 类不均衡 支持向量数据描述 中图分类号:TP181 文献标识码:A 文章编号:1007 - 9807 (20 13)04 - 0008 - 14 0 引 言 样本,因此情况变得更加复杂. 鉴于类重叠问题和类不均衡在管理中的重要 , 性和复杂性 许多学者致力于研究两者的解决方 、 、 在信用卡欺诈识别 客户流失分析 企业财务 . , ,

您可能关注的文档

文档评论(0)

136****3783 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档