- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
摘要
类分布不平衡数据与人们的生活息息相关,准确地分类这些数据具有非常
重要的意义,因此不平衡数据分类成为数据挖掘领域的热点。面向不平衡数据
分类时,传统的分类器往往失效,组合分类器性能也不理想,并且组合分类器
还有占用内存空间大、预测响应时间长的不足。组合剪枝算法被广泛的应用解
决上述问题,但是常见的组合剪枝算法多用训练实例集作为剪枝集,倾向选择
出对负类实例更有利的基分类器,因此不宜应用到面向不平衡数据的组合分类
器的剪枝中。目前单纯面向类分布不平衡实例集的组合剪枝算法较少有人涉及,
本文从选择创建面向不平衡类的组合剪枝集出发,创建面向不平衡数据的组合
分类器。
首先本文基于SMOTE(thesyntheticminorityover-samplingtechnique)和简单
basedon set
随机欠抽样技术,提出了EPPS(Ensemble ofSMOTE)
Pruning pp·uning
basedon set
和EPPU(EnsemblePruning pl。uning
种算法分别把SMOTE和简单随机欠抽样技术应用创建相对平衡的剪枝集,用于
监督组合分类器的剪枝过程,提升组合分类器对不平衡数据的分类性能;然后,
basedOnPositive
本文又提出了EPPE(EnsemblePruning Examples)算法,EPPE把
正类及其边界负类实例作为剪枝集,选择出基分类器池中对正类及其边界附近
的负类分类性能良好的基分类器,创建出面向不平衡实例集的组合分类器。实
用更小的剪枝集创建出具有更好的分类泛化性能的组合剪枝分类器,尤其是
EPPE在大部分的实例集上显著好于其它的分类算法,并且三种组合剪枝算法都
能显著降低组合分类器的规模。
关键词:不平衡类组合剪枝剪枝集K.近邻
Abstract
Abstract
Class·imbalancedatais relatedto life.Itisof
closely daily greatimportance
to thesedata imbalanced
significanceclassify correctly,SO dataclassificationisahot
researchinthefieldofdata state-of-the—art
topic mining.However,traditional
classifiersand
ensembledonotworkwellondatasetsforimbalancedclass
ensemblenot toomuch also
distribution.Meanwhile,the
onlyoccupies memory,but
increasesthe timeof of
ensemble
significantly response style
prediction.The pruning
is tosolvetheabov
文档评论(0)