- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2014 4 4
小 型 微 型 计 算 机 系 统 年 月 第 期
Journal of Chinese Computer Systems Vol. 35 No . 4 2014
一种面向非平衡数据集分类问题的组合选择方法
, , ,
职为梅 郭华平 张银峰 范 明
( , 450052)
郑州大学信息工程学院 郑州
E-mail :iew mzhi@ zzu. edu. cn
: , . ,
摘 要 由于类分布的不平衡性 很多传统的分类方法在非平衡数据集上的分类效果不好 与传统的方法不同 论文从组合选
, CBES ,
择的角度考虑不平衡类学习问题 提出了一种基于实例的组合选择方法 提升组合分类器在不平衡数据集上的分类性
. CBES k , ,
能 考察类标号未知的样本的 近邻 并以此为选择集 从分类器库中选择一个最优或次优的子组合分类器来预测未知
. , , CBES .
样本的类标号 由于考虑了待分类样本的局部特征 更关注稀有类 因此 能够更好地对非平衡数据集进行分类 实验结果
, , .
表明 本文的方法能够显著地降低模型的复杂度 有效地提高了非平衡数据集上的分类性能
: ; ; ;k ;
关键词 非平衡数据集 组合分类器 组合选择 近邻 基分类器
中图分类号:TP181 文献标识码:A 文章编号:1000-1220 (2014)04-0770-06
Case-based Ensemble Selection for the Classification of Imbalanced Datasets
ZHI Wei-mei ,GUO Hua-ping ,ZHANG Yin-feng ,FAN M ing
(College of Information Engineering ,Zhengzhou University ,Zhengzhou 450052 ,China)
Abstract :Because of imbalanced class distribution ,most classifiers do not w ork w ell on imbalanced datasets. Unlike traditional meth-
ods ,this paper reconsiders class imbalance learning problem from the view point of ensemble selection ,and proposes a new method ,
named case-based ensemble selection approach (CBES),to improve classifiers performance on these datasets. CBES tries to search
for the k-nearest neighbors of an unlabeled instance as the selection set ,and then select an optimal or sub
文档评论(0)