- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
分析流程
数据源:
贝碧嘉.xlsx
算法配置:
算法:梯度提升树(GBDT)回归
分析结果:
梯度提升树(GBDT)回归基于MSE、RMSE、MAE、MAPE、R2指标对模型进行评价,请看详细结论。
分析步骤
1.通过训练集数据来建立梯度提升树(GBDT)回归模型。
2.通过建立的梯度提升树(GBDT)来计算特征重要性。
3.将建立的梯度提升树(GBDT)回归模型应用到训练、测试数据,得到模型评估结果。
4.由于梯度提升树(GBDT)具有随机性,每次运算的结果不一样,若保存本次训练模型,后续可以直接上传数据代入到本次训练模型进行计算预测。
5.注:梯度提升树(GBDT)无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。
详细结论
输出结果1:模型参数
参数名
参数值
训练用时
0.453s
数据切分
0.7
数据洗牌
是
交叉验证
10
损失函数
friedman_mse
节点分裂评价准则
friedman_mse
基学习器数量
100
学习率
0.1
无放回采样比例
1
划分时考虑的最大特征比例
None
内部节点分裂的最小样本数
2
叶子节点的最小样本数
1
叶子节点中样本的最小权重
0
树的最大深度
10
叶子节点的最大数量
50
节点划分不纯度的阈值
0
图表说明:
上表展示了模型各项参数配置以及模型训练时长。
输出结果2:特征重要性
图表说明:
上柱形图或表格展示了各特征(自变量)的重要性比例。
输出结果3:模型评估结果
MSE
RMSE
MAE
MAPE
R2
训练集
0
0.017
0.014
2.59
0.999
交叉验证集
0.513
0.708
0.599
98.9
-1.02
测试集
0.359
0.599
0.472
99.388
-0.269
图表说明:
上表中展示了交叉验证集、训练集和测试集的预测评价指标,通过量化指标来衡量GBDT的预测效果。其中,通过交叉验证集的评价指标可以不断调整超参数,以得到可靠稳定的模型。
●MSE(均方误差):预测值与实际值之差平方的期望值。取值越小,模型准确度越高。
●RMSE(均方根误差):为MSE的平方根,取值越小,模型准确度越高。
●MAE(平均绝对误差):绝对误差的平均值,能反映预测值误差的实际情况。取值越小,模型准确度越高。
●MAPE(平均绝对百分比误差):是MAE的变形,它是一个百分比值。取值越小,模型准确度越高。
●R2:将预测值跟只使用均值的情况下相比,结果越靠近1模型准确度越高。
输出结果4:预测结果
预测测试集结果Y
降水量
台风起始时间
台风结束时间
当前台风时间
经度
纬度
风速
气压
移动速度
1.2283568725153426
1.2000000000000002
2
2
42
136.3
27.3
20
992
20
0.32397474094519835
0.6000000000000001
4
4
225
108.5
20.2
28
982
7
1.1750223268737252
1.1
2
2
41
136
27
20
992
25
0.1336734588906721
1.8
4
4
114
111.4
18.2
15
998
18
1.3617871041922176
0.9
4
4
131
111.5
21.2
15
998
10
1.1961822811192262
0.7000000000000001
3
3
94
107
19.6
20
990
10
0.14068562085865294
0.1
3
3
106
106.6
20.4
18
991
10
0.8949397956731692
1
4
4
230
108
19.9
28
982
15
1.3566134227014064
1.6
4
4
129
111.2
21.5
15
998
7
0.9242334257358557
0.4
4
4
220
109.4
20.5
20
990
10
1.1414901920765115
1.3
4
4
132
112
20.9
15
998
0
0.8383855970926323
0.8
3
3
61
113.4
19.4
23
990
20
0.8539927623420799
0.7000000000000001
4
4
203
111.9
20.9
25
982
10
0.357783015248278
1.2000000000000002
4
4
152
112.9
20.7
18
990
0
0.7378452033029878
1.4000000000000001
4
4
157
113.1
20.6
20
9
您可能关注的文档
- 2024年MathorCup大数据挑战赛论文格式及提交规范.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.docx
- Pearson相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Spearman相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 描述性统计_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 数据概览_台风编号_经度_纬度.docx
- 数据概览_经度_纬度_台风等级.docx
- extra_tree回归_(台风起始时间-台风结束时间-当前台风时间-经度-气压-移动速度-纬度-降水量)_(风速).docx
- gbdt回归_(台风起始时间-台风结束时间-经度-当前台风时间-台风等级-气压-纬度-移动速度-降水量)_(风速).docx
- xgboost回归_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-风速-气压-移动速度)_(降水量).docx
- 决策树回归_(台风起始时间-台风结束时间-当前台风时间-经度-风速-气压-纬度-移动速度-台风等级)_(降水量).docx
- 决策树回归(经度).docx
- extra_tree回归_(台风起始时间-台风结束时间-当前台风时间-风速-经度-气压-移动速度-降水量)_(纬度).docx
- gbdt回归_(台风起始时间-台风结束时间-经度-当前台风时间-台风等级-风速-气压-移动速度-降水量)_(纬度).docx
- 决策树回归_(经度-台风起始时间-台风结束时间-当前台风时间-风速-气压-移动速度-降水量-台风强度)_(纬度).docx
- B初赛妈妈杯大数据数学建模.pdf
- 描述性统计妈妈杯大数据数学建模.docx
- extra_tree回归(经度)妈妈杯大数据数学建模.docx
- gbdt回归_(经度)妈妈杯大数据数学建模.docx
最近下载
- 《古建筑木结构维护与加固技术标准》(GB_T 50165—2020)修订解析.pdf VIP
- 七年级数学知识竞赛课件 (共42张PPT).pptx VIP
- 八年级数学趣味数学知识竞赛课件(比赛用) (共51张PPT).pptx VIP
- 七年级数学趣味数学竞赛比赛用课件 (共48张PPT).pptx VIP
- 《少盐限油健康饮食》课件.ppt VIP
- 2022年初中数学趣味数学竞赛课件(共43张ppt).pptx VIP
- 新员工三级安全教育培训(岗前)PPT课件.pptx VIP
- 常用电气形符号表.doc VIP
- DBJ51-143-2020 四川省公共建筑节能设计标准.pdf VIP
- 黑龙江建设工程安全文明施工费使用管理办法.doc VIP
文档评论(0)