- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于混合采样的非平衡数据分类算法-计算机科学与探索
计算机科学与探索 1673-9418/2019/ 13(02)-0342-08
Journal of Frontiers of Computer Science and Technology doi: 10.3778/j.issn. 1673-9418.1804041
基于混合采样的非平衡数据分类算法*
1,2 1,2+ 1,2
吴艺凡 ,梁吉业 ,王俊红
1. 山西大学 计算机与信息技术学院,太原 030006
2. 山西大学 计算智能与中文信息处理教育部重点实验室,太原 030006
+ 通讯作者 E-mail: ljy@
摘 要:过采样和欠采样方法是处理非平衡数据集分类的常用方法,但使用单一的采样算法可能造成少数类
样本过拟合或者丢失含有重要信息的样本。提出了基于分类超平面的混合采样算法SVM_HS(hybrid sampling
algorithm based on support vector machine ),旨在克服SVM 算法在处理非平衡数据时分类超平面容易偏向少
数类样本的问题。该算法首先利用SVM 算法得到分类超平面。然后迭代进行混合采样,主要包括:(1)删除离
分类超平面较远的一些多数类样本;(2 )对靠近真实类边界的少数类样本用SMOTE(synthetic minority over-
sampling technique)过采样,使分类超平面向着真实类边界方向偏移。实验结果表明相比其他相关算法,该算
法的F-value 值和G-mean 值均有较大提高。
关键词:非平衡;支持向量机(SVM);少数类样本过采样技术(SMOTE);分类超平面;混合采样
文献标志码:A 中图分类号:TP391
吴艺凡, 梁吉业, 王俊红. 基于混合采样的非平衡数据分类算法[J]. 计算机科学与探索, 2019, 13(2): 342-349.
WU Y F, LIANG J Y, WANG J H. Classification algorithm based on hybrid sampling for unbalanced data[J]. Jour-
nal of Frontiers of Computer Science and Technology, 2019, 13(2): 342-349.
Classification Algorithm Based on Hybrid Sampling for Unbalanced Data
1,2 1,2+ 1,2 索
WU Yifan , LIANG Jiye , WANG Junhong
1. School of Computer and Information Technology, Shanxi University, Taiyuan 030006, China
探
2. Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education,
与
Shanxi University, Taiyuan 030006, China 学 g
Abstract: The over-sampling and under-sampling that are used to classify unbalanced datasets are common methods.
科 r
However, the two methods either lead to over-fitting or lose important samples. Based on this insight, a hybrid
您可能关注的文档
- 基于微粒群算法的BuckrBoost矩阵变换器主电路-湖南科技大学学报.PDF
- 基于成本的车间作业优化模型及实证研究-中国管理科学.PDF
- 基于惯性-摩擦原理的PZT驱动四自由度微驱动器的研究-光学精密工程.PDF
- 基于拔桩能力的自升式平台海外作业优选-海洋石油.PDF
- 基于挤压灢剪切模式的高转矩磁流变离合器设计与试验-光学精密工程.PDF
- 基于拟Broyden法的非线性系统参数优化迭代学习-大连理工大学学报.PDF
- 基于振动时效仿真的流变塑性模型-中国材料进展.PDF
- 基于振动理论的摇包内单相流体运动研究-NSFC.PDF
- 基于振动理论的生物质燃料压实机设计-新能源.PDF
- 基于振动频率法的斜拉桥索力测试影响因素-中南大学学报.PDF
文档评论(0)