网站大量收购独家精品文档,联系QQ:2885784924

随机森林算法在信用卡欺诈检测中的改进与应用.pdf

随机森林算法在信用卡欺诈检测中的改进与应用.pdf

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要 在信息技术迅速发展的带动下,人类生活的方式发生了很大的改变,生活水平和 质量越来越高,与此同时,科技的发展也产生了巨大数量的信息,各类型信息以数据 的形式呈指数增长,“大数据”一词开始频繁出现在人们的生活当中。海量数据的背 后是丰富的重要信息,这些信息通常为各种决策提供依据,而利用机器学习理论可以 帮助人类学习其中蕴藏的有用知识。机器学习方法有很多种,随机森林是其中常见的 方法之一。这是一种新型的组合分类器算法,使用性能良好,且广泛应用于多种领域。 欺诈是当前信用卡业务的主要风险,由于其造成的损失数额巨大,引发了诸多研 究,信用卡反欺诈领域便是当前机器学习研究的热点领域之一。但是,随机森林还存 在一些缺陷。一方面,随机地选择特征,减少了数据关联性,但也会使模型训练强度 降低。另一方面,在不平衡分类的问题上,使用随机森林模型不能准确地预测结果。 这使得随机森林相关的优化问题十分具有研究价值。 本文从算法的特征选择和不平衡分类问题两个方面进行了研究,探索其中的改进 方法。一方面,在对特征选择问题的改进研究上,首先通过卡方检验得出特征的关联 性,然后依据关联性的大小设定一个阈值,从而在阈值前后两个区间上随机抽样选取 特征,最后将抽样出的特征集合起来,就是选择出来的特征。另一方面,在对不平衡 分类问题的改进研究上,将平衡随机森林的思想与加权随机森林的思想共同考虑进 来,扬长避短,从而完成对算法的改进。F1值被用于对实验结果的对比和评估。最 后,本文进行了总结,阐述了对随机森林特征选择和不平衡分类问题的改善成果,并 指出了后续研究的方向。 关键词:随机森林 反欺诈 不平衡分类 I 目录 摘要I ABSTRACTII 1 绪论1 1.1研究背景及意义1 1.1.1研究背景1 1.1.2研究意义2 1.2研究现状2 1.2.1随机森林2 1.2.2特征选择3 1.2.3不平衡分类3 1.2.4总结分析4 1.3研究目的与研究内容4 1.4论文的组织结构5 2 基础理论概述6 2.1机器学习6 2.1.1机器学习概述6 2.1.2机器学习发展过程6 2.1.3分类算法概述7 2.2随机森林算法8 2.2.1集成方法8 2.2.2决策树8 2.2.3随机森林算法10 2.2.4随机森林的特点11 2.3信用风险评分卡12 3 信用卡欺诈检测问题分析13 3.1信用卡欺诈风险概述13 3.2信用卡欺诈检测问题描述13 3.3不平衡分类问题分析14 3.3.1不平衡分类问题定义14 3.3.2不平衡分类面临的困难14 3.3.3不平衡分类的相关方法15 3.3.4不平衡分类的评价准则15 3.4本章小结16 IV 4 随机森林算法的改进17 4.1随机森林的特征选择改进17 4.1.1传统随机森林17 4.1.2改进思想18 4.1.3改进方法20 4.2类不平衡问题与模型改进21 4.2.1平衡随机森林21 4.2.2加权随机森林22 4.2.3改进思想22 4.2.4改进方法23 4.3本章小结24 5 基于信用卡欺诈检测的随机森林模型实验结果与分析25 5.1实验数据25 5.1.1数据来源25 5.1.2数据处理26 5.2模型基础参数选择26 5.3随机森林特征选择的改进实验31 5.3.1实验结果31 5.3.2结果分析33 5.4不平衡分类问题改进实验33 5.4.1实验结果33 5.4.2结果分析33 5.5本章小结34 6 总结与展望35 6.1总结35 6.2展望36 参考文献37 个人简介40 致谢42

您可能关注的文档

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档