基于商空间理论的非平衡数据集分类算法_张健.pdfVIP

  • 4
  • 0
  • 约2.2万字
  • 约 3页
  • 2017-08-06 发布于浙江
  • 举报

基于商空间理论的非平衡数据集分类算法_张健.pdf

基于商空间理论的非平衡数据集分类算法_张健

Journal of Computer Applications ISSN 1001-9081 2012-01-01 计算机应用,2012 ,32( 1) : 210 - 212 CODEN JYIIDU http: / / www. joca. cn 文章编号:1001 - 9081 (2012)01 - 0210 - 03 doi :10 . 3724 / SP. J. 1087 . 2012 . 00210 基于商空间理论的非平衡数据集分类算法 * , , , 张 健 方宏彬 孙启林 刘明术 ( , 230039) 安徽大学数学科学学院 合肥 ( * 通信作者电子邮箱zj520zj @ 163 . com) : , , 摘 要 在机器学习及其分类问题时经常会遇到非平衡数据集 为了提高非平衡数据集分类的有效性 提出了基 , QMSVM 。 , 于商空间理论的过采样分类算法 即 算法 对训练集中多数类样本进行聚类结构划分 所得划分结果和少数 (SVM) , ; , 类样本合并进行线性支持向量机 学习 从而获取多数类样本的支持向量和错分的样本粒 另一方面 获取少数 , SMOTE , SVM , 类样本的支持向量和错分的样本 进行 采样 最后把上述得到的两类样本合并进行 学习 这样来实现学 , 。 , , 习数据集的再平衡处理 从而得到更加合理的分类超平面 实验结果表明 和其他几种算法相比 所提算法虽在正确 + , g_means acc , 。 分类率上有所降低 但较大改善了 值和 值 且对非平衡率较大的数据集效果会更好 : ; ; ; ;QMSVM 关键词 非平衡数据集 商空间理论 支持向量机 过采样 算法 中图分类号:TP311. 13 文献标志码:A Classification algorithm for imbalance dataset based on quotient space theory

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档