面向类分布不平衡数据的组合分类器剪枝方法地研究.pdf

面向类分布不平衡数据的组合分类器剪枝方法地研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要 摘要 类分布不平衡数据与人们的生活息息相关,准确地分类这些数据具有非常 重要的意义,因此不平衡数据分类成为数据挖掘领域的热点。面向不平衡数据 分类时,传统的分类器往往失效,组合分类器性能也不理想,并且组合分类器 还有占用内存空间大、预测响应时间长的不足。组合剪枝算法被广泛的应用解 决上述问题,但是常见的组合剪枝算法多用训练实例集作为剪枝集,倾向选择 出对负类实例更有利的基分类器,因此不宜应用到面向不平衡数据的组合分类 器的剪枝中。目前单纯面向类分布不平衡实例集的组合剪枝算法较少有人涉及, 本文从选择创建面向不平衡类的组合剪枝集出发,创建面向不平衡数据的组合 分类器。 首先本文基于SMOTE(thesyntheticminorityover-samplingtechnique)和简单 basedon set 随机欠抽样技术,提出了EPPS(Ensemble ofSMOTE) Pruning pp·uning basedon set 和EPPU(EnsemblePruning pl。uning 种算法分别把SMOTE和简单随机欠抽样技术应用创建相对平衡的剪枝集,用于 监督组合分类器的剪枝过程,提升组合分类器对不平衡数据的分类性能;然后, basedOnPositive 本文又提出了EPPE(EnsemblePruning Examples)算法,EPPE把 正类及其边界负类实例作为剪枝集,选择出基分类器池中对正类及其边界附近 的负类分类性能良好的基分类器,创建出面向不平衡实例集的组合分类器。实 用更小的剪枝集创建出具有更好的分类泛化性能的组合剪枝分类器,尤其是 EPPE在大部分的实例集上显著好于其它的分类算法,并且三种组合剪枝算法都 能显著降低组合分类器的规模。 关键词:不平衡类组合剪枝剪枝集K.近邻 Abstract Abstract Class·imbalancedatais relatedto life.Itisof closely daily greatimportance to thesedata imbalanced significanceclassify correctly,SO dataclassificationisahot researchinthefieldofdata state-of-the—art topic mining.However,traditional classifiersand ensembledonotworkwellondatasetsforimbalancedclass ensemblenot toomuch also distribution.Meanwhile,the onlyoccupies memory,but increasesthe timeof of ensemble significantly response style prediction.The pruning is tosolvetheabov

文档评论(0)

llllss930 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档