- 2
- 0
- 约3.05千字
- 约 10页
- 2025-10-20 发布于甘肃
- 举报
分析流程
数据源:
问题1-计算数据.xlsx
算法配置:
算法:随机森林分类
分析结果:
随机森林分类基于准确率、召回率、精确率、F1指标对模型进行评价,请看详细结论。
分析步骤
1.通过训练集数据来建立随机森林分类模型。
2.通过建立的随机森林来计算特征重要性。
3.将建立的随机森林分类模型应用到训练、测试数据,得到模型的分类评估结果。
4.由于随机森林中具有随机性,每次运算的结果不一样,若保存本次训练模型,后续可以直接上传数据代入到本次训练模型进行计算分类。
5.注:随机森林无法像传统模型一样得到确定的方程,通常通过测试数据分类效果来对模型进行评价。
详细结论
输出结果1:模型参数
参数名
参数值
训练用时
1.605s
数据切分
0.7
数据洗牌
是
交叉验证
10
节点分裂评价准则
gini
决策树数量
100
有放回采样
true
袋外数据测试
false
划分时考虑的最大特征比例
auto
内部节点分裂的最小样本数
2
叶子节点的最小样本数
1
叶子节点中样本的最小权重
0
树的最大深度
10
叶子节点的最大数量
50
节点划分不纯度的阀值
0
图表说明:
上表展示了模型各项参数配置以及模型训练时长。
输出结果2:特征重要性
图表说明:
上柱形图或表格展示了各特征(自变量)的重要性比例。
输出结果3:混淆矩阵热力图
图表说明:
上表以热力图的形式展示了混淆矩阵。
输出结果4:模型评估结果
准确率
召回率
精确率
F1
训练集
0.921
0.921
0.928
0.918
交叉验证集
0.763
0.763
0.756
0.739
测试集
0.76
0.76
0.75
0.731
图表说明:
上表中展示了训练集和测试集的分类评价指标,通过量化指标来衡量随机森林对训练、测试数据的分类效果。
●准确率:预测正确样本占总样本的比例,准确率越大越好。
●召回率:实际为正样本的结果中,预测为正样本的比例,召回率越大越好。
●精确率:预测出来为正样本的结果中,实际为正样本的比例,精确率越大越好。
●F1:精确率和召回率的调和平均,精确率和召回率是互相影响的,虽然两者都高是一种期望的理想情况,然而实际中常常是精确率高、召回率就低,或者召回率低、但精确率高。若需要兼顾两者,那么就可以用F1指标。
●oob_score:对于分类问题,oob_score是袋外数据的准确率。若在建立树过程中选择有放回抽样时,大约1/3的记录没有被抽取。没有被抽取的自然形成一个对照数据集,可用于模型的验证。所以随机森林不需要另外预留部分数据做交叉验证,其本身的算法类似交叉验证,而且袋外误差是对预测误差的无偏估计(当算法参数选择了“袋外测试数据”后,才会通过oob_score来检验模型的泛化能力)。
输出结果5:预测结果
预测结果Y
Classification
预测测试结果概率_1.0
预测测试结果概率_2.0
Currentcheckingaccountstatus
Durationwithinmonth
Credithistory
Purpose
Creditamount
Savingsaccount/bonds
Presentemploymentsince
Installmentrateinpercentageofdisposableincome
Personalstatusandsex
Otherdebtors/guarantors
Presentresidencesince
1.0
2.0
0.6437594103238636
0.3562405896761362
1
12
2
8
759
4
3
4
4
3
2
2.0
2.0
0.404838001454863
0.5951619985451368
2
48
2
110
10961
4
3
1
4
3
2
1.0
1.0
0.7354799386803882
0.2645200613196121
2
8
2
8
760
4
2
4
4
2
2
2.0
2.0
0.4181829821783235
0.5818170178216766
1
48
2
39
3931
4
3
4
4
3
4
1.0
1.0
0.8097762729209664
0.19022372707903298
4
9
4
24
2406
1
3
2
1
3
3
1.0
1.0
0.8702669108148571
0.12973308918514317
4
12
2
8
804
5
3
4
5
3
4
1.0
1.0
0.8717793837200979
0.12822061627990228
4
24
2
31
3062
您可能关注的文档
- 译亚太杯分赛道五岳杯一等奖.pdf
- 2024 APMCM Wuyue Cup Problem亚太杯分赛道五岳杯一等奖.pdf
- 基于QUBO模型的信用评分卡组合优化研究_许宏飞.pdf
- 基于QUBO模型的信用卡最优获利组合规划_王文鹤.pdf
- 探索量子加速人工智能的前沿.docx
- apmcmlz2302188亚太杯分赛道五岳杯一等奖.pdf
- 2024 APMCM Wuyue Cup Control Sheet亚太杯分赛道五岳杯一等奖.docx
- 2024 APMCM Wuyue Cup Essay format and s亚太杯分赛道五岳杯一等奖ubmission specifications.pdf
- 2024 APMCM Wuyue Cup Summary Sheet亚太杯分赛道五岳杯一等奖.docx
- 译2024 APMCM Wuyue Cup Essay format and亚太杯分赛道五岳杯一等奖 submission specifications.pdf
原创力文档

文档评论(0)