基于遗传算法改进的少数类样本合成过采样技术的非平衡数据集分类算法.pdfVIP

基于遗传算法改进的少数类样本合成过采样技术的非平衡数据集分类算法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于遗传算法改进的少数类样本合成过采样技术的非平衡数据集分类算法.pdf

JournalofComputerApplications ISSN 1o0l一9081 2015 01.10 计算机应用,2015,35(1):121—124,139 C0DEN JYIIDU http://www.joca.en 文章编号 :1001.9081(2015)01.0121.04 doi:10.11772/j.issn.1001-9081.2015.O1.0121 基于遗传算法改进的 少数类样本合成过采样技术的非平衡数据集分类算法 霍玉丹 。,谷 琼 ,蔡之华 ,袁 磊 (1.湖北文理学院数学与计算机科学学院,湖北 襄阳441053; 2.中国地质大学 计算机学院,武汉430074; 3.西南大学 逻辑与智能研究中心,重庆400715) (}通信作者电子邮箱 gujone@163.com) 摘 要 :针对少数类样本合成过采样技术(SMOTE)在处理非平衡数据集分类问题 时,为少数类的不同样本设置 相同的采样倍率,存在一定的盲 目性的问题,提 出了一种基于遗传算法 (GA)改进的SMOTE方法——GASM0TE。首 先,为少数类的不同样本设置不同的采样倍率,并将这些采样倍率取值的组合编码为种群中的个体;然后,循环使用 GA的选择、交叉、变异等算子对种群进行优化,在达到停机条件时获得采样倍率取值的最优组合 ;最后 ,根据找到的 最优组合对非平衡数据集进行SMOTE采样。在 10个典型的非平衡数据集上进行的实验结果表明:与SMOTE算法相 比,GASMOTE在F-measure值上提高了5.9个百分点,在 G-mean值上提高了1.6个百分点;与Borderline.SMOTE 算法 相比,GASMOTE在F.measure值上提高了3.7个百分点,在 G—mean值上提高了2.3个百分点。该方法可作为一种新 的解决非平衡数据集分类 问题的过采样技术。 关键词:非平衡数据集;分类;少数类样本合成过采样技术;采样倍率;遗传算法 中图分类号:TP311.13;TP18 文献标志码:A Classificationmethodforimbalancedatasetbasedon geneticalgorithm improvedsyntheticminorityover-samplingtechnique HUOYudan一,GUQiong,,CAIZhihua,YUANLei (1.SchoolofMathematcisandComputerScience,HubeiUniversityofArtsand Science,XiangyangHubei441053,China; 2.SchoolofComputerScience,ChinaUniveni@ofGeosciences,WuhanHubei430074,China; 3.CenterfortheStudyofLogicand InteUigence,SouthwestUniversity,Chongqing400715,China) Abstract:WhentheSyntheticMinorityOver—samplingTechnique(SMOTE)isusedinimbalancedatasetclassification, itsetsthesanlesamplingrateforallthesamplesofminori~ classintheprocessofsynthetisingnew samples,whichhas blindness.Toovercomethisproblem,aGenet

文档评论(0)

月光般思恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档