- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
分析流程
数据源:
CardFraud(1).xlsx
算法配置:
算法:描述性统计
分析结果:
描述性统计基于数据汇总统计产生结果,请看详细结论。
分析步骤
1.首先,对总体的各项统计指标进行整体描述分析。
2.其次,对异常或者表现得较为突出的指标进行分析,例如高方差、高平均值等等。
详细结论
输出结果1:总体描述结果
变量名
样本量
最大值
最小值
平均值
标准差
中位数
方差
峰度
偏度
变异系数(CV)
Distance1
10000
2033.498
0.049
26.375
58.811
10.027
3458.746
204.713
10.189
2.23
Distance2
10000
990.07
0.001
4.807
22.26
1.006
495.513
762.94
23.457
4.631
Ratio
10000
65.151
0.011
1.824
2.762
1.006
7.631
91.145
6.819
1.514
Repeat
10000
1
0
0.879
0.326
1
0.106
3.404
-2.325
0.371
Card
10000
1
0
0.351
0.477
0
0.228
-1.609
0.625
1.36
Pin
10000
1
0
0.105
0.306
0
0.094
4.662
2.581
2.923
Online
10000
1
0
0.641
0.48
1
0.23
-1.652
-0.59
0.748
Fraud
10000
1
0
0.084
0.278
0
0.077
6.987
2.998
3.3
图表说明:
上表展示了描述性统计的结果,包括样本量、最大值、最小值等统计量,用于研究定量数据的整体情况。
1.分析各项统计指标,对各项统计指标进行整体描述分析。
2.对异常的或者表现得较为突出的指标进行分析,例如高方差,高平均值等等。
智能分析:
基于Distance1,变异系数(CV)为2.23,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。
基于Distance2,变异系数(CV)为4.631,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。
基于Ratio,变异系数(CV)为1.514,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。
基于Repeat,变异系数(CV)为0.371,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。
基于Card,变异系数(CV)为1.36,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。
基于Pin,变异系数(CV)为2.923,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。
基于Online,变异系数(CV)为0.748,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。
基于Fraud,变异系数(CV)为3.3,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。
输出结果2:散点图
Distance1散点图
Distance2散点图
Ratio散点图
Repeat散点图
Card散点图
Pin散点图
Online散点图
Fraud散点图
图表说明:
上图以散点图的形式展示了Distance1、Distance2、Ratio、Repeat、Card、Pin、Online、Fraud频数分析集中趋势分析的结果,可以用来估计或预测总体。
输出结果3:箱型图
Distance1箱型图
Distance2箱型图
Ratio箱型图
Repeat箱型图
Card箱型图
Pin箱型图
Online箱型图
Fraud箱型图
图表说明:
上图以箱线图的形式展示了Distance1、Distance2、Ratio、Repeat、Card、Pin、Online、Fraud频数分析离散趋势分析的结果,离散趋势用极大值、极小值、25%分位数、中位数、75%分位数等统计指标对数据分布进行差异(稳定性)测量。
PS:极大值、极小值并非该数据的最大值、最小值,该值为箱线图的内限,即大于极大值或小于极小值的点视为异常点。
参考文献
[1]?ScientificPlatformServingforStatisticsProfessional2021.SPSSPRO.(Version1.0.11)[OnlineApplicationSoftware].?Retrievedfrom.
[2]
您可能关注的文档
最近下载
- 渠道护砌工程施工方案砼预制块护坡施工渠道砼工程砼格埂.docx VIP
- 气调库工程项目可行性研究报告.docx
- 2025年二级矿井维修电工(技师)技能认定理论考试题库资料(含答案).pdf
- 功能性食品学 课件 第8章 益生菌及其活性代谢物.pptx
- 实验室质量管理体系文件.docx VIP
- 电工高级技师实操考试试卷.pdf VIP
- 初中阶段初阶词汇初级-如何记单词.docx VIP
- 中文版安德森吞咽困难量表的信效度和临床应用评价.pdf VIP
- (正式版)D-L∕T 611-2016 300MW~600M级机组煤粉锅炉运行导则.docx VIP
- BSL实验室生物安全管理体系文件.docx VIP
文档评论(0)