- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于谱聚类欠取样的不均衡数据SVM分类算法-控制与决策
第27 卷 第12 期 控 制 与 决 策 2012 年 12 月
Vol. 27 No. 12 Control and Decision Dec. 2012
文章编号: 1001-0920 (2012) 12-1761-08
基于谱聚类欠取样的不均衡数据SVM 分类算法
陶新民, 张冬雪, 郝思媛, 付丹丹
(哈尔滨工程大学信息与通信工程学院,哈尔滨150001)
摘 要: 提出一种基于谱聚类欠取样的不均衡数据支持向量机(SVM) 分类算法. 该算法首先在核空间中对多数类
样本进行谱聚类; 然后在每个聚类中根据聚类大小和该聚类与少数类样本间的距离, 选择具有代表意义的信息点; 最
终实现训练样本间的数目均衡. 实验中将该算法同其他不均衡数据预处理方法相比较, 结果表明该算法不仅能有效
提高SVM 算法对少数类的分类性能, 而且总体分类性能及运行效率都有明显提高.
关键词: 不均衡数据;SVM 算法;谱聚类;欠取样
中图分类号: TP391 文献标志码: A
SVM classifier for unbalanced data based on spectrum cluster-based
under-sampling approaches
TAO Xin-min, ZHANG Dong-xue, HAO Si-yuan, FU Dan-dan
(College of Information and Communication Engineering,Harbin Engineering University ,Harbin 150001 ,China.
Correspondent :TAO Xin-min ,E-mail :taoxinmin@)
Abstract: An under-sampling unbalanced dataset support vector machine(SVM) algorithm based on spectrum cluster is
presented. Majority instances are clustered by using spectrum cluster in kernel space for resampling reprentative samples
with cluster information. The number of selected samples in each cluster is dependent on the size of each cluster and the
distance of the cluster to the all minority instances, which can not only reduce the number of majority instances, but also the
SVM classification performance under unbalanced dataset is improved by using the proposed method. In the experiments, the
proposed approach is compared with other data-preprocess methods for unbalanced dataset classification. The experimental
results show that the proposed method can not only improve classification performance of SVM algorithm in the minority
class data, but also increase the overall classification performance and effectivity.
您可能关注的文档
- 基于激光的多相流测试技术应用研究进展-激光与红外杂志.PDF
- 基于激光回馈干涉系统的PZT迟滞特性测量-激光与红外杂志.PDF
- 基于煤系气双管柱分压合采技术的适用性分析-煤炭学报.PDF
- 基于生产线特性的精益生产控制策略研究!.PDF
- 基于激光多普勒技术的犘犣犜薄膜压电性能测试研究.PDF
- 基于潮位校正的盐城滨海潮间带遥感监测及变化分析-HaiyangXuebao.PDF
- 基于电磁感应的典型干旱区土壤盐分时空变异快速诊断-农业机械学报.PDF
- 基于电场分析的钛合金电解加工圆孔成形研究.PDF
- 基于稳定碳同位素技术的养殖贝类碳源分析-上海海洋大学学报.PDF
- 基于生态足迹的河南生态承载力评价-中国农学通报.PDF
- 基于脉冲中子源的元素分析测井仪设计-国外电子测量技术.PDF
- 基于视频的人脸验证1VideoBasedFaceVerification-清华大学.PDF
- 基于负压灌溉系统的温室番茄蒸发蒸腾量自动检测-农业工程学报.PDF
- 基于输出的建筑结构分散滑模控制-计算力学学报.PDF
- 基于酶抑制法的农药残留快速检测仪器现状及评价-食品安全质量检测.PDF
- 基于边缘保护扩散的梯度矢量流测地线活动轮廓模型-Journalof.PDF
- 基于线性参照系统的虚拟高速铁路场景建模方法-地理学报.PDF
- 基于重叠子孔径极坐标算法的波前弯曲效应的补偿-电子学报.PDF
- 基于霍特林变换的稻米彩色图像粒形检测算法-复合材料学报.PDF
- 基于非合作博弈的冷热电联供微能源网运行策略优化-电力系统自动化.PDF
文档评论(0)