一种基于核SMOTE的非平衡数据集分类方法.pdfVIP

  • 90
  • 0
  • 约6.57万字
  • 约 7页
  • 2016-03-14 发布于安徽
  • 举报

一种基于核SMOTE的非平衡数据集分类方法.pdf

一种基于核SMOTE的非平衡数据集分类方法.pdf

第 11 期 电  子   学   报 Vol . 37  No . 11  2009 年 11 月 ACTA ELECTRONICA SINICA Nov .  2009   一种基于核 SMOTE 的非平衡数据集分类方法 1 ,2 2 2 2 曾志强 ,吴  群 ,廖备水 ,高  济 ( 1 厦门理工学院计算机科学与技术系 ,福建厦门 361024 ;2 浙江大学计算机科学与技术学院 ,浙江杭州 310027)   摘  要 :  本文提出一种基于核 SMOTE ( Synthetic Minority Oversampling Technique) 的分类方法来处理支持向量机 ( ) SVM 在非平衡数据集上的分类问题. 其核心思想是首先在特征空间中采用核 SMOTE 方法对少数类样本进行上采 样 ,然后通过输入空间和特征空间的距离关系寻找所合成样本在输入空间的原像 ,最后再采用 SVM 对其进行训练. 实 验表明 ,核 SMOTE 方法所合成的样本质量高于 SMOTE 算法 ,从而有效提高 SVM 在非平衡数据集上的分类效果. 关键词 :  非平衡数据集 ; 支持向量机 ; 输入空间; 特征空间; 原像 中图分类号 :  TP181    文献标识码 :  A    文章编号 : (2009) A Cla s sfication Metho d For Imbalance Dat a Set Ba se d on Kernel SMO TE ZEN G Zhiqiang1 ,2 ,WU Qun2 ,L IAO Beishui2 , GAO Ji2 ( 1Dep artment of Comp uter Science and Technology , Xiamen University of Technology , Xiamen , Fuj ian 361024 , China ; 2 College of Comp uter Science and Technology , Zhej iang University , Hangzhou , Zhej iang 310027 , China) Ab stract :  An approach based on kernel SMO TE ( Synthetic Minority Oversampling Technique) to solve classification on imbalance data set by Supp ort Vector Machine (SVM) is presented . The method first oversamples the minority class in feature sp ace by kernel SMO TE algorithm ,then the preimages of the synthetic instances are found based on a distance relation between feature sp ace and input sp ace . Finally ,these preima

文档评论(0)

1亿VIP精品文档

相关文档