- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
分析流程
数据源:
贝碧嘉.xlsx
算法配置:
算法:XGBoost回归
分析结果:
XGBoost回归基于MSE、RMSE、MAE、MAPE、R2指标对模型进行评价,请看详细结论。
分析步骤
1.通过训练集数据来建立XGBoost回归模型。
2.通过建立的XGBoost来计算特征重要性。
3.将建立的XGBoost回归模型应用到训练、测试数据,得到模型评估结果。
4.由于XGBoost具有随机性,每次运算的结果不一样,若保存本次训练模型,后续可以直接上传数据代入到本次训练模型进行计算预测。
5.注:XGBoost无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。
详细结论
输出结果1:模型参数
参数名
参数值
训练用时
1.127s
数据切分
0.7
数据洗牌
是
交叉验证
10
基学习器
gbtree
基学习器数量
100
学习率
0.1
L1正则项
0
L2正则项
1
样本征采样率
1
树特征采样率
1
节点特征采样率
1
叶子节点中样本的最小权重
0
树的最大深度
10
图表说明:
上表展示了模型各项参数配置以及模型训练时长。
输出结果2:特征重要性
图表说明:
上柱形图或表格展示了各特征(自变量)的重要性比例。
输出结果3:模型评估结果
MSE
RMSE
MAE
MAPE
R2
训练集
0
0.01
0.005
0.022
1
交叉验证集
1.234
0.585
0.294
1.57
0.779
测试集
0.129
0.359
0.163
0.77
0.94
图表说明:
上表中展示了交叉验证集、训练集和测试集的预测评价指标,通过量化指标来衡量XGBoost的预测效果。其中,通过交叉验证集的评价指标可以不断调整超参数,以得到可靠稳定的模型。
●MSE(均方误差):预测值与实际值之差平方的期望值。取值越小,模型准确度越高。
●RMSE(均方根误差):为MSE的平方根,取值越小,模型准确度越高。
●MAE(平均绝对误差):绝对误差的平均值,能反映预测值误差的实际情况。取值越小,模型准确度越高。
●MAPE(平均绝对百分比误差):是MAE的变形,它是一个百分比值。取值越小,模型准确度越高。
●R2:将预测值跟只使用均值的情况下相比,结果越靠近1模型准确度越高。
输出结果4:预测结果
预测测试集结果Y
纬度
台风起始时间
台风结束时间
当前台风时间
台风强度
风速
经度
气压
降水量
移动速度
19.47064781188965
19.3
3
3
68
2
23
111.8
990
0.8
20
18.477149963378906
18.2
4
4
115
1
15
111.4
998
0.1
15
20.623184204101562
20.8
4
4
150
2
18
112.8
990
1.8
5
21.190567016601562
21.2
4
4
193
3
25
113
982
1.7000000000000002
10
19.567834854125977
19.5
3
3
63
2
23
113
990
0.7000000000000001
20
20.593172073364258
20.9
4
4
123
1
15
111.6
998
1.2000000000000002
14
18.504657745361328
19
3
3
53
2
20
115
994
1.5
15
20.693147659301758
20.6
4
4
143
2
18
112.5
990
0.2
7
20.472864151000977
20.5
4
4
167
2
23
113.4
985
1.7000000000000002
0
19.554807662963867
19.6
4
4
244
3
28
106.2
982
1.4000000000000001
15
20.512895584106445
20.5
4
4
220
2
20
109.4
990
0.4
10
20.0854434967041
19.9
4
4
118
1
15
110.9
998
1
5
21.219810485839844
21.9
4
4
126
1
15
112
998
0.30000000000000004
5
21.426692962646484
21.3
4
4
130
1
15
111.3
998
1.5
10
21.009069442749023
21.2
4
4
197
3
25
112.3
982
1.2000000000000002
10
图表说明:
上表格为预览结果,只显示部分数据,全部数据请点击下载按钮导出。
上表展示了XG
您可能关注的文档
- 2024年MathorCup大数据竞赛论文模板.docx
- 2024年MathorCup大数据挑战赛论文格式及提交规范.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道B初赛.docx
- 2024年MathorCup大数据挑战赛-赛道B初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.docx
- Kendall一致性检验_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Pearson相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Spearman相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 描述性统计_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 中国国家标准 GB/T 32857-2025保护层分析(LOPA)应用导则.pdf
- 《GB/T 32857-2025保护层分析(LOPA)应用导则》.pdf
- GB/T 20736-2025传动用精密滚子链和板式链疲劳试验方法.pdf
- 《GB/T 20736-2025传动用精密滚子链和板式链疲劳试验方法》.pdf
- 中国国家标准 GB/T 20736-2025传动用精密滚子链和板式链疲劳试验方法.pdf
- 2026年毛概期末考试试题库附参考答案(研优卷).docx
- 2026广东省四会市教育局赴高校招聘教师98人(第一轮)备考题库附答案.docx
- 2026年重庆青年职业技术学院单招(计算机)测试模拟题库附答案.docx
- 2026年黑龙江三江美术职业学院单招(计算机)考试参考题库推荐.docx
- 2025年浙商银行嘉兴分行四季度社会招聘备考题库附答案.docx
原创力文档


文档评论(0)