- 0
- 0
- 约2.6千字
- 约 10页
- 2025-10-18 发布于甘肃
- 举报
分析流程
数据源:
贝碧嘉.xlsx
算法配置:
算法:梯度提升树(GBDT)回归
分析结果:
梯度提升树(GBDT)回归基于MSE、RMSE、MAE、MAPE、R2指标对模型进行评价,请看详细结论。
分析步骤
1.通过训练集数据来建立梯度提升树(GBDT)回归模型。
2.通过建立的梯度提升树(GBDT)来计算特征重要性。
3.将建立的梯度提升树(GBDT)回归模型应用到训练、测试数据,得到模型评估结果。
4.由于梯度提升树(GBDT)具有随机性,每次运算的结果不一样,若保存本次训练模型,后续可以直接上传数据代入到本次训练模型进行计算预测。
5.注:梯度提升树(GBDT)无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。
详细结论
输出结果1:模型参数
参数名
参数值
训练用时
0.465s
数据切分
0.7
数据洗牌
是
交叉验证
10
损失函数
friedman_mse
节点分裂评价准则
friedman_mse
基学习器数量
100
学习率
0.1
无放回采样比例
1
划分时考虑的最大特征比例
None
内部节点分裂的最小样本数
2
叶子节点的最小样本数
1
叶子节点中样本的最小权重
0
树的最大深度
10
叶子节点的最大数量
50
节点划分不纯度的阈值
0
图表说明:
上表展示了模型各项参数配置以及模型训练时长。
输出结果2:特征重要性
图表说明:
上柱形图或表格展示了各特征(自变量)的重要性比例。
输出结果3:模型评估结果
MSE
RMSE
MAE
MAPE
R2
训练集
0
0
0
0
1
交叉验证集
1.471
0.741
0.31
0.264
0.958
测试集
0.133
0.365
0.181
0.156
0.996
图表说明:
上表中展示了交叉验证集、训练集和测试集的预测评价指标,通过量化指标来衡量GBDT的预测效果。其中,通过交叉验证集的评价指标可以不断调整超参数,以得到可靠稳定的模型。
●MSE(均方误差):预测值与实际值之差平方的期望值。取值越小,模型准确度越高。
●RMSE(均方根误差):为MSE的平方根,取值越小,模型准确度越高。
●MAE(平均绝对误差):绝对误差的平均值,能反映预测值误差的实际情况。取值越小,模型准确度越高。
●MAPE(平均绝对百分比误差):是MAE的变形,它是一个百分比值。取值越小,模型准确度越高。
●R2:将预测值跟只使用均值的情况下相比,结果越靠近1模型准确度越高。
输出结果4:预测结果
预测测试集结果Y
经度
台风起始时间
台风结束时间
当前台风时间
纬度
台风等级
风速
气压
移动速度
降水量
112.96845710188877
112.8
4
4
194
21.2
10
25
982
10
0.6000000000000001
112.80417486884991
112.9
4
4
152
20.7
8
18
990
0
1.2000000000000002
130.6994741785426
130.7
2
2
32
15.6
8
18
993
10
0.1
108.08093860577506
108.1
4
4
229
19.9
10
28
982
10
1.8
107.91474534172684
108.1
4
4
227
20
10
28
982
10
0.5
108.81751803470137
108.5
3
3
82
19
8
18
991
15
1.6
111.29490978078545
111.1
4
4
209
20.9
10
25
982
13
1.8
113.64552689000264
113.6
4
4
174
20.6
9
23
985
4
1.6
112.13388865943018
112.1
4
4
136
21.1
8
18
990
0
1.4000000000000001
106.61793007902023
106.4
4
4
242
19.7
10
28
982
15
0.7000000000000001
113.50018657878377
113.6
4
4
185
21.1
10
25
982
12
0.6000000000000001
111.6946174853401
111.7
4
4
205
20.9
10
25
982
10
1.2000000000000002
113.29996145545473
113.3
4
4
161
20.6
9
23
985
0
0.4
108.81751803470137
108.3
3
3
83
19.1
8
18
991
15
1.7000000000000002
11
您可能关注的文档
- 2024年MathorCup大数据竞赛论文模板.docx
- 2024年MathorCup大数据挑战赛论文格式及提交规范.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道B初赛.docx
- 2024年MathorCup大数据挑战赛-赛道B初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.docx
- Kendall一致性检验_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Pearson相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Spearman相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 描述性统计_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
最近下载
- SY_T 5106-2019 石油天然气钻采设备 封隔器规范.docx VIP
- 世界著名谈判案例.docx VIP
- T_CPI 11037-2024 石油天然气钻采设备水力振荡器技术与应用规范.docx VIP
- 雪铁龙维修 手册 图DS_5LS_Owner_Book_ZH.pdf VIP
- 2025至2030药用真菌行业项目调研及市场前景预测评估报告.docx
- T_SCMES 24—2024(石油天然气钻采设备智能钻机).pdf VIP
- 财务共享模式下企业内部控制研究——以延长石油为例.docx VIP
- 财务共享延长石油集成方案.pdf VIP
- 2025《延安延长石油集团财务共享中心实施效果分析的案例报告》8200字.doc VIP
- 2025人教版音乐一年级下册全册教学设计教案.pdf
原创力文档

文档评论(0)