基于不平衡数据的聚类抽样方法-南京大学学报自然科学.doc

下载文档 降价啦

5
0
约1.41万字
约 11页
2017-09-04 发布于天津
举报
版权申诉
保障服务

基于不平衡数据的聚类抽样方法-南京大学学报自然科学.doc

1、本文档共11页，其中可免费阅读4页，需付费100金币后方可阅读剩余内容。
2、本文档内容版权归属内容提供方，所产生的收益全部归内容提供方所有。如果您对本文有版权争议，可选择认领，认领后既往收益都归您。
3、本文档由用户上传，本站不保证质量和数量令人满意，可能有诸多瑕疵，付费之前，请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形，可联系本站下载客服投诉处理。
4、文档侵权举报电话：400-050-0827(电话支持时间：9:00-18:30)。

一种基于不平衡数据的聚类抽样方法朱亚奇邓维斌重庆邮电大学计算智能重庆市重点实验室重庆西南交通大学信息科学与技术学院成都摘要许多研究表明传统分类器在对海量不平衡数据分类时偏向多数类规则因此会导致少数类实例被错误判断为多数类针对上述问题提出了一种基于分解求解的学习分类算法算法先对样本数据进行聚类在聚类的基础上多次根据权值对数据集进行欠抽样产生平衡的数据集对每个平衡数据集进行验证同时提高误判样本的权值综合考虑每个基分类器的错误率作为分类器的权值选择分类效果较好的基分类器进行加权集成实验表明算法有较高的

一种基于不平衡数据的聚类抽样方法朱亚奇1,邓维斌1 ,2* (1. 重庆邮电大学计算智能重庆市重点实验室，重庆，400065； 2. 西南交通大学信息科学与技术学院，成都，610031 ) 摘要：许多研究表明传统分类器在对海量不平衡数据分类时偏向多数类规则，因此，会导致少数类实例被错误判断为多数类。针对上述问题，提出了一种基于分解求解的学习分类算法。算法先对样本数据进行聚类，在聚类的基础上多次根据权值对数据集进行欠抽样，产生平衡的数据集，对每个平衡数据集进行验证同时提高误判样本的权值。综合考虑每个基分类器的错误率作为分类器的权值，选择分类效果较好的基分类器进行加权集成。实验表明算法有较