网站大量收购独家精品文档,联系QQ:2885784924

基于不平衡数据的聚类抽样方法-南京大学学报自然科学.doc

基于不平衡数据的聚类抽样方法-南京大学学报自然科学.doc

  1. 1、本文档共11页,其中可免费阅读4页,需付费100金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于不平衡数据的聚类抽样方法朱亚奇邓维斌重庆邮电大学计算智能重庆市重点实验室重庆西南交通大学信息科学与技术学院成都摘要许多研究表明传统分类器在对海量不平衡数据分类时偏向多数类规则因此会导致少数类实例被错误判断为多数类针对上述问题提出了一种基于分解求解的学习分类算法算法先对样本数据进行聚类在聚类的基础上多次根据权值对数据集进行欠抽样产生平衡的数据集对每个平衡数据集进行验证同时提高误判样本的权值综合考虑每个基分类器的错误率作为分类器的权值选择分类效果较好的基分类器进行加权集成实验表明算法有较高的

一种基于不平衡数据的聚类抽样方法 朱亚奇1,邓维斌1 ,2* (1. 重庆邮电大学计算智能重庆市重点实验室,重庆,400065; 2. 西南交通大学信息科学与技术学院,成都,610031 ) 摘 要:许多研究表明传统分类器在对海量不平衡数据分类时偏向多数类规则,因此,会导致少数类实例被错误判断为多数类。针对上述问题,提出了一种基于分解求解的学习分类算法。算法先对样本数据进行聚类,在聚类的基础上多次根据权值对数据集进行欠抽样,产生平衡的数据集,对每个平衡数据集进行验证同时提高误判样本的权值。综合考虑每个基分类器的错误率作为分类器的权值,选择分类效果较好的基分类器进行加权集成。实验表明算法有较

文档评论(0)

wangyueyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档