基于单边选择链和样本分布密度融合机制的非平衡数据挖掘-电子学报.PDF

基于单边选择链和样本分布密度融合机制的非平衡数据挖掘-电子学报.PDF

基于单边选择链和样本分布密度融合机制的非平衡数据挖掘-电子学报

第 期 电 子 学 报 7 Vol.42 No.7 年 月 2014 7 ACTAELECTRONICASINICA Jul. 2014 基于单边选择链和样本分布密度融合机制的 非平衡数据挖掘方法 , 12 3 4 2 2 翟 云 ,王树鹏 ,马 楠 ,杨炳儒 ,张德政 ( 国家行政学院电子政务研究中心,北京 ; 北京科技大学计算机与通信工程学院,北京 ; 1. 1000892. 100083 中国科学院信息工程研究所,北京 ; 北京联合大学信息学院,北京 ) 3. 1000934. 100101 摘 要: 非平衡数据集分类问题是机器学习领域的重大挑战性难题 针对该难题,传统的少数类样本合成技术 . ( , )已成为一种有力手段并得到广泛采用 但在新样本生成过程中, SyntheticMinorityOverSamplingTechniqueSMOTE . 利用所有少数类样本合成新样本,由此产生过拟合瓶颈 为更好地解决该问题,提出了一种基于单边选择链和 SMOTE . 样本分布密度的非平衡数据挖掘新方法( , ) 通 OneSidedLink&DistributionDensitySMOTEOSLDDSMOTE.OSLDDSMOTE 过单边选择链遴选出处于分类边界的少数类样本,根据这些样本的动态分布密度生成新样本 进而分析了样本合成度 . 对节点数目和对少数类精度的影响;基于 、 和 三个指标综合比较了 与其他同类方 GmeanFmeasure AUC OSLDDSMOTE 法的分类性能 实验结果表明, 有效提高了少数类样本的分类准确率 . OSLDDSMOTE . 关键词: 非平衡数据分类;单边选择链;分布密度;重采样 中图分类号: 文献标识码: 文章编号: ( ) TP18 A 03722112201407131109 电子学报 : :

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档