- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
分析流程
数据源:
贝碧嘉.xlsx
算法配置:
算法:XGBoost回归
分析结果:
XGBoost回归基于MSE、RMSE、MAE、MAPE、R2指标对模型进行评价,请看详细结论。
分析步骤
1.通过训练集数据来建立XGBoost回归模型。
2.通过建立的XGBoost来计算特征重要性。
3.将建立的XGBoost回归模型应用到训练、测试数据,得到模型评估结果。
4.由于XGBoost具有随机性,每次运算的结果不一样,若保存本次训练模型,后续可以直接上传数据代入到本次训练模型进行计算预测。
5.注:XGBoost无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。
详细结论
输出结果1:模型参数
参数名
参数值
训练用时
1.017s
数据切分
0.7
数据洗牌
是
交叉验证
10
基学习器
gbtree
基学习器数量
100
学习率
0.1
L1正则项
0
L2正则项
1
样本征采样率
1
树特征采样率
1
节点特征采样率
1
叶子节点中样本的最小权重
0
树的最大深度
10
图表说明:
上表展示了模型各项参数配置以及模型训练时长。
输出结果2:特征重要性
图表说明:
上柱形图或表格展示了各特征(自变量)的重要性比例。
输出结果3:模型评估结果
MSE
RMSE
MAE
MAPE
R2
训练集
0.001
0.035
0.013
0.011
1
交叉验证集
0.141
0.341
0.212
0.187
0.987
测试集
0.121
0.348
0.193
0.171
0.994
图表说明:
上表中展示了交叉验证集、训练集和测试集的预测评价指标,通过量化指标来衡量XGBoost的预测效果。其中,通过交叉验证集的评价指标可以不断调整超参数,以得到可靠稳定的模型。
●MSE(均方误差):预测值与实际值之差平方的期望值。取值越小,模型准确度越高。
●RMSE(均方根误差):为MSE的平方根,取值越小,模型准确度越高。
●MAE(平均绝对误差):绝对误差的平均值,能反映预测值误差的实际情况。取值越小,模型准确度越高。
●MAPE(平均绝对百分比误差):是MAE的变形,它是一个百分比值。取值越小,模型准确度越高。
●R2:将预测值跟只使用均值的情况下相比,结果越靠近1模型准确度越高。
输出结果4:预测结果
预测测试集结果Y
经度
台风起始时间
台风结束时间
当前台风时间
纬度
台风强度
风速
气压
降水量
移动速度
106.0379638671875
105.7
4
4
248
19.4
2
23
990
0.9
15
112.5875473022461
112.7
4
4
146
20.6
2
18
990
0.8
6
115.38117218017578
115.5
3
3
47
18.3
2
18
998
1.7000000000000002
15
113.67208862304688
113.7
4
4
181
21
2
23
985
0.6000000000000001
3
112.73213195800781
112.8
4
4
149
20.8
2
18
990
1.7000000000000002
5
106.00700378417969
105
4
4
249
19.3
2
18
992
0.7000000000000001
22
112.715576171875
112.8
4
4
194
21.2
3
25
982
0.6000000000000001
10
110.90210723876953
110.3
4
4
117
19.8
1
15
998
1.6
6
110.11314392089844
109.3
4
4
221
20.5
3
25
985
0.5
10
113113.3
4
4
160
20.6
2
20
990
1.1
0
107.8990478515625
108
4
4
230
19.9
3
28
982
1
15
111.06510162353516
111.4
4
4
112
17.9
1
15
998
1.4000000000000001
10
115.28208923339844
115.3
3
3
50
18.5
2
20
994
1.5
15
111.20030975341797
111.3
4
4
208
20.9
3
25
982
0.8
12
107.61965942382812
107.7
4
4
232
19.9
3
28
982
0.4
15
图表说明:
上表格为预览结果,只显示部分数据,全部数据请点击下载按钮导出。
上表展示了XGBoost对测试
您可能关注的文档
- 2024年MathorCup大数据竞赛论文模板.docx
- 2024年MathorCup大数据挑战赛论文格式及提交规范.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道B初赛.docx
- 2024年MathorCup大数据挑战赛-赛道B初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.docx
- Kendall一致性检验_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Pearson相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Spearman相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 描述性统计_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 主题课程整理大班上.doc
- 2026人教版小学语文三年级上册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学语文四年级下册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学二年级上册数学期末综合试卷精选3套(含答案解析).docx
- 2026人教版小学语文四年级上册期末综合试卷3套(含答案解析).docx
- 2026人教版小学二年级下册数学期末综合试卷3套(打印版含答案解析).docx
- 2026年地理信息行业年终总结汇报PPT.pptx
- 板块四第二十一单元封建时代的欧洲和亚洲 中考历史一轮复习.pptx
- 中考历史一轮复习:板块四第二十单元古代亚、非、欧文明+课件.pptx
- 第二次工业革命和近代科学文化中考历史一轮复习.pptx
原创力文档


文档评论(0)