基于边界样本欠取样支持向量机的电信用户欠费分类算法.PDFVIP

基于边界样本欠取样支持向量机的电信用户欠费分类算法.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于边界样本欠取样支持向量机的电信用户欠费分类算法

研究与开发 基于边界样本欠取样支持向量机的电信用户欠费分类算法 李创创,卢光跃,王航龙 (西安邮电大学无线网络安全技术国家工程实验室,陕西西安 710121 ) 摘 要:电信用户欠费预测是一个不平衡数据集分类问题。针对传统支持向量机(SVM )对不均衡数据集中 少数类检测精度低的问题,基于分类平面由边界样本的位置决定,提出了一种通过删除部分多数类边界样本 的方法来改善传统SVM 算法的不足,将该算法和其他几种算法在电信数据和多个不平衡UCI 数据集上的实 验结果进行对比,验证所提算法对少数类的检测精度和总体评价指标都有所提高。 关键词:欠费;不均衡;SVM;边界;欠取样 中图分类号:TP181 文献标识码:A doi: 10.11959/j.issn.1000-0801.2017208 SVM classifier for telecom user arrears based on boundary samples-based under-sampling approaches LI Chuangchuang, LU Guangyue, WANG Hanglong National Engineering Laboratory for Wireless Security, Xi’an University of Posts and Telecommunications, Xi’an 710121, China Abstract: Telecom users’ arrears forecasting is a classification problem of unbalanced data set. To deal with the problem that the traditional SVM on the unbalanced date set had a low detection accuracy of minority class, a novel method was proposed. Based on the fact that the position of classification plane was determined by the boundary samples, the proposed method was implemented via removing some of samples closed to the classification plane to avoid the deficiency of the traditional SVM algorithm. Finally, the proposed method was compared with other ap- proaches on unbalanced data sets. The simulation results show that the proposed method can not only increase the detection accuracy of minority but also improve the overall classification performance. Key words: arrear, unbalance, support vector machine, boundary, under-sampling 很大影响。为了减少坏账,增加公司利润,越来 1 引言 越多的运营商通过建立用户欠费预测模型,提前 近年来,随着电信运营商之间的竞争日益激

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档