- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
队伍编号dsa2400271
题号(B)
应用集成机器学习对电信银行卡诈骗的数据分析研究
摘要
现阶段电信银行卡诈骗问题日益严峻,对个人财产安全和社会稳定构成了严重威
胁。为此本文通过综合运用相关性分析、灰色关联分析、集成机器学习以及Stacking模
型融合方法,借助MATLAB和SPSS等工具,深入探究了电信诈骗的分布特征及其指
标间的关联性。本研究不仅量化了各个特征对电信诈骗的影响程度,还特别分析了银
行卡转账是否为同银行及是否为线上交易这两个关键特征与诈骗行为的显著联系。
此外,本文还对电信银行卡诈骗进行了有效预测,从而在实践应用中降低诈骗发生的
概率,对维护社会秩序,以及保障公民财产安全具有一定参考价值。
为提高数据的精度,首先本文对电信银行卡交易数据集进行预处理,包括识别并
处理样本不均衡问题、探索性分析以及特征的分箱和编码。其次,进行数据结构优化
和归一化。然后基于不平衡数据采用SMOTE过采样技术进行平衡,并通过逻辑回归算
法评估原始与过采样后的数据集分类效果,最终确定采用优化后的采样数据。
针对问题1,发生电信银行卡诈骗数据的绘图分析。首先本文通过数据可视化技术
绘制扇形图和柱状图,深入分析了电信银行卡诈骗的分布和特点,其中“有无发生电
信银行卡诈骗”比例见图5,线上和线下诈骗案例的数量对比见图6。之后进一步分析
探讨了诈骗行为的分布特征、发展趋势及其对用户行为和银行安全策略的影响。
针对问题2,评估发生电信诈骗的指标特征之间的关联性。本文利用灰色关联分析
法,通过针对电信诈骗案例中“使用银行卡设备转账”和“使用银行卡PIN码转账”
两个指标,评估了它们与电信诈骗发生的关联性,发生电信诈骗的关联程度效果见图7,
发生电信诈骗的概率分布见表9,结果显示使用银行卡在设备上进行转账交易的情况下
更容易发生电信诈骗,同时使用PIN的转账交易在电信诈骗的概率上降低了0.09%。
针对问题3,发生电信诈骗指标之间的相关性探究。本文首先对采用SMOTE技术
优化后的数据集采用相关性分析对特征指标影响程度进行量化,之后使用Kendall’s
W检验对模型进行优化处理,结果显示总体数据的显著性P值为0.000***,Kendall协
调系数值为0.817,因此相关性的程度为高度的一致性。最后绘制Spearman秩相关系
数和Kendall秩相关系数热力图见图9,数据结果显示Distance1、Ratio、Repeat和
Online与电信诈骗的发生具有较强的正相关性,而Card和Pin则显示出负相关性。此
外,发生电信银行卡诈骗的显著程度见表10。
针对问题4,基于电信银行卡诈骗的预测分析。首先,本文在问题3相关性分析模
型计算结果的基础上,通过建立基于集成机器学习对电信银行卡诈骗的预测模型,分
别使用GBDT、XGBoost、RUSBoost算法对电信银行卡诈骗进行预测。其次,通过
stacking的方法进行模型融合,同3种基学习器对比得出最优解见表12-13。其中stack-
ing融合模型的F1得分在四个分类器中最高,均达到0.98以上,说明stacking融合模型
对电信银行卡诈骗的预测方面具有较高的泛化能力,从训练效果发现融合后的模型比
单独的基学习器效果更好。最后基于研究成果,分别向公安部门、银行和市民们提出
了一份建议。
最后,本文针对电信银行卡诈骗预测模型进行了灵敏度检验和测试模型的鲁棒性,
用于进一步提高模型的精准度。
关键词:电信诈骗;相关性分析;灰色关联分析;机器学习;Stacking融合
目录
1问题重述1
1.1研究背景与意义1
1.2文献综述1
1.3研究选题2
2研究思路2
3模型假设3
4符号说明3
5数据的预处理4
5.1样本数据的处理4
5.2数据集特征探索5
5.3样本数据的结构优化7
6问题1:发生电信银行卡诈骗数据的绘图
您可能关注的文档
- gbdt分类数学建模竞赛.docx
- Spearman相关性分析数学建模竞赛.docx
- Kendall一致性检验数学建模竞赛.docx
- Kendall's tau-b相关性分析数学建模竞赛.docx
- RUSBoost数学建模竞赛.docx
- xgboost分类数学建模竞赛.docx
- 基于SICAS模型的佳帮手直播营销策略优化研究_王冰.pdf
- 正态性校验数学建模竞赛.docx
- A题优秀论文-5数学建模竞赛.pdf
- 描述性统计数学建模竞赛.docx
- 浙江省温州市浙南名校联盟2025-2026学年高一上学期期中联考数学试题含解析.docx
- 26高考数学提分秘诀重难点34圆锥曲线中的定点、定值、定直线问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点35概率与统计的综合问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点31圆锥曲线中的切线与切点弦问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点30圆锥曲线中的弦长问题与长度和、差、商、积问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点29巧解圆锥曲线的离心率问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点28直线与圆的综合(举一反三专项训练)(全国通用)(含解析).docx
- 寡核苷酸药物重复给药毒性研究技术指南.docx
- 重组溶瘤腺病毒生产质量管理标准.docx
- 26高考数学提分秘诀重难点27直线与圆中常考的最值与范围问题(举一反三专项训练)(全国通用)(含解析).docx
原创力文档


文档评论(0)