- 0
- 0
- 约2.82千字
- 约 9页
- 2025-10-18 发布于甘肃
- 举报
分析流程
数据源:
贝碧嘉.xlsx
算法配置:
算法:ExtraTrees回归
分析结果:
ExtraTrees回归基于MSE、RMSE、MAE、MAPE、R2指标对模型进行评价,请看详细结论。
分析步骤
1.通过训练集数据来建立ExtraTrees回归模型。
2.通过建立的ExtraTrees来计算特征重要性。
3.将建立的ExtraTrees回归模型应用到训练、测试数据,得到模型评估结果。
4.由于ExtraTrees具有随机性,每次运算的结果不一样,若保存本次训练模型,后续可以直接上传数据代入到本次训练模型进行计算预测。
5.注:ExtraTrees无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。
详细结论
输出结果1:模型参数
参数名
参数值
训练用时
1.017s
数据切分
0.7
数据洗牌
是
交叉验证
10
节点分裂评价准则
mse
划分时考虑的最大特征比例
None
内部节点分裂的最小样本数
2
叶子节点的最小样本数
1
叶子节点中样本的最小权重
0
树的最大深度
10
叶子节点的最大数量
50
节点划分不纯度的阈值
0
决策树数量
100
有放回采样
true
袋外数据测试
false
图表说明:
上表展示了模型各项参数配置以及模型训练时长。
输出结果2:特征重要性
图表说明:
上柱形图或表格展示了各特征(自变量)的重要性比例。
输出结果3:模型评估结果
MSE
RMSE
MAE
MAPE
R2
训练集
0.045
0.213
0.119
0.105
0.998
交叉验证集
0.83
0.642
0.363
0.31
0.969
测试集
0.421
0.649
0.349
0.306
0.984
图表说明:
上表中展示了训练集和测试集的预测评价指标,通过量化指标来衡量ExtraTrees回归的预测效果。
●MSE(均方误差):预测值与实际值之差平方的期望值。取值越小,模型准确度越高。
●RMSE(均方根误差):为MSE的平方根,取值越小,模型准确度越高。
●MAE(平均绝对误差):绝对误差的平均值,能反映预测值误差的实际情况。取值越小,模型准确度越高。
●MAPE(平均绝对百分比误差):是MAE的变形,它是一个百分比值。取值越小,模型准确度越高。
●R2:将预测值跟只使用均值的情况下相比,结果越靠近1模型准确度越高。
●oob_score:对于回归问题,oob_score是袋外数据的R2。若在建立树过程中选择有放回抽样时,大约1/3的记录没有被抽取。没有被抽取的自然形成一个对照数据集,可用于模型的验证。所以ExtraTrees不需要另外预留部分数据做交叉验证,其本身的算法类似交叉验证,而且袋外误差是对预测误差的无偏估计(当算法参数选择了“袋外测试数据”后,才会通过oob_score来检验模型的泛化能力)。
输出结果4:预测结果
预测测试集结果Y
经度
台风起始时间
台风结束时间
当前台风时间
纬度
风速
气压
移动速度
降水量
115.3332595238095
116.1
3
3
45
18.2
18
998
16
1.7000000000000002
111.4020028138527
111.4
4
4
113
18.1
15
998
12
0.30000000000000004
113.00676767676761
112.9
4
4
153
20.6
20
990
0
0.5
113.33395695693198
113.3
4
4
164
20.6
23
985
0
0.6000000000000001
113.60419162226663
113.7
4
4
184
21.1
23
985
3
1.7000000000000002
113.64360688200686
113.7
4
4
180
21
23
985
3
0.30000000000000004
110.96995454545451
110.8
4
4
211
20.9
25
982
10
1.7000000000000002
112.91346474636474
113.6
4
4
185
21.1
25
982
12
0.6000000000000001
112.63880073815075
112.8
4
4
151
20.8
18
990
5
0.1
107.45828611111115
107.4
4
4
235
19.9
28
982
13
0.9
132.29950000000002
130.9
2
2
35
19.2
20
992
20
1.8
113.23516666666666
113.4
3
3
61
19.4
23
您可能关注的文档
- 2024年MathorCup大数据竞赛论文模板.docx
- 2024年MathorCup大数据挑战赛论文格式及提交规范.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道B初赛.docx
- 2024年MathorCup大数据挑战赛-赛道B初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.docx
- Kendall一致性检验_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Pearson相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Spearman相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 描述性统计_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
最近下载
- 宝马电梯图纸BMDT-5000电气原理图纸2009年NICE3000.pdf
- 血液中心质量管理科年度工作总结和工作计划.doc VIP
- 特种设备日常使用状况记录.xls VIP
- 2025年XX血液中心工作总结及2026年工作计划.docx VIP
- 第九版外科学 绪论.pptx VIP
- 特种设备日常维护保养记录表.xls VIP
- 2025年澳大利亚袋鼠数学竞赛C卷L3(5-6年级)中国赛区试题(含答案).docx VIP
- 第九版-外科学-教学大纲.pptx VIP
- 《差动变压器式(LVDT)位移传感器》-毕业论文(设计).doc VIP
- 2024-2025学年八年级英语下学期月考试卷 人教版 Units 1~2(安徽专用)解析版.docx VIP
原创力文档

文档评论(0)