描述性统计数学建模竞赛.docxVIP

描述性统计数学建模竞赛.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

分析流程

数据源:

CardFraud(1).xlsx

算法配置:

算法:描述性统计

分析结果:

描述性统计基于数据汇总统计产生结果,请看详细结论。

分析步骤

1.首先,对总体的各项统计指标进行整体描述分析。

2.其次,对异常或者表现得较为突出的指标进行分析,例如高方差、高平均值等等。

详细结论

输出结果1:总体描述结果

变量名

样本量

最大值

最小值

平均值

标准差

中位数

方差

峰度

偏度

变异系数(CV)

Distance1

10000

2033.498

0.049

26.375

58.811

10.027

3458.746

204.713

10.189

2.23

Distance2

10000

990.07

0.001

4.807

22.26

1.006

495.513

762.94

23.457

4.631

Ratio

10000

65.151

0.011

1.824

2.762

1.006

7.631

91.145

6.819

1.514

Repeat

10000

1

0

0.879

0.326

1

0.106

3.404

-2.325

0.371

Card

10000

1

0

0.351

0.477

0

0.228

-1.609

0.625

1.36

Pin

10000

1

0

0.105

0.306

0

0.094

4.662

2.581

2.923

Online

10000

1

0

0.641

0.48

1

0.23

-1.652

-0.59

0.748

Fraud

10000

1

0

0.084

0.278

0

0.077

6.987

2.998

3.3

图表说明:

上表展示了描述性统计的结果,包括样本量、最大值、最小值等统计量,用于研究定量数据的整体情况。

1.分析各项统计指标,对各项统计指标进行整体描述分析。

2.对异常的或者表现得较为突出的指标进行分析,例如高方差,高平均值等等。

智能分析:

基于Distance1,变异系数(CV)为2.23,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。

基于Distance2,变异系数(CV)为4.631,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。

基于Ratio,变异系数(CV)为1.514,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。

基于Repeat,变异系数(CV)为0.371,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。

基于Card,变异系数(CV)为1.36,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。

基于Pin,变异系数(CV)为2.923,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。

基于Online,变异系数(CV)为0.748,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。

基于Fraud,变异系数(CV)为3.3,大于0.15,当前数据中可能存在异常值,建议对异常的或者表现得较为突出的指标进行分析。

输出结果2:散点图

Distance1散点图

Distance2散点图

Ratio散点图

Repeat散点图

Card散点图

Pin散点图

Online散点图

Fraud散点图

图表说明:

上图以散点图的形式展示了Distance1、Distance2、Ratio、Repeat、Card、Pin、Online、Fraud频数分析集中趋势分析的结果,可以用来估计或预测总体。

输出结果3:箱型图

Distance1箱型图

Distance2箱型图

Ratio箱型图

Repeat箱型图

Card箱型图

Pin箱型图

Online箱型图

Fraud箱型图

图表说明:

上图以箱线图的形式展示了Distance1、Distance2、Ratio、Repeat、Card、Pin、Online、Fraud频数分析离散趋势分析的结果,离散趋势用极大值、极小值、25%分位数、中位数、75%分位数等统计指标对数据分布进行差异(稳定性)测量。

PS:极大值、极小值并非该数据的最大值、最小值,该值为箱线图的内限,即大于极大值或小于极小值的点视为异常点。

参考文献

[1]?ScientificPlatformServingforStatisticsProfessional2021.SPSSPRO.(Version1.0.11)[OnlineApplicationSoftware].?Retrievedfrom.

[2]

文档评论(0)

星空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档