- 5
- 0
- 约2.59千字
- 约 8页
- 2025-10-18 发布于甘肃
- 举报
分析流程
数据源:
贝碧嘉.xlsx
算法配置:
算法:ExtraTrees回归
分析结果:
ExtraTrees回归基于MSE、RMSE、MAE、MAPE、R2指标对模型进行评价,请看详细结论。
分析步骤
1.通过训练集数据来建立ExtraTrees回归模型。
2.通过建立的ExtraTrees来计算特征重要性。
3.将建立的ExtraTrees回归模型应用到训练、测试数据,得到模型评估结果。
4.由于ExtraTrees具有随机性,每次运算的结果不一样,若保存本次训练模型,后续可以直接上传数据代入到本次训练模型进行计算预测。
5.注:ExtraTrees无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。
详细结论
输出结果1:模型参数
参数名
参数值
训练用时
0.974s
数据切分
0.7
数据洗牌
是
交叉验证
10
节点分裂评价准则
mse
划分时考虑的最大特征比例
None
内部节点分裂的最小样本数
2
叶子节点的最小样本数
1
叶子节点中样本的最小权重
0
树的最大深度
10
叶子节点的最大数量
50
节点划分不纯度的阈值
0
决策树数量
100
有放回采样
true
袋外数据测试
false
图表说明:
上表展示了模型各项参数配置以及模型训练时长。
输出结果2:特征重要性
图表说明:
上柱形图或表格展示了各特征(自变量)的重要性比例。
输出结果3:模型评估结果
MSE
RMSE
MAE
MAPE
R2
训练集
0.029
0.172
0.072
0.366
0.998
交叉验证集
0.263
0.437
0.241
1.226
0.98
测试集
0.125
0.353
0.156
0.776
0.992
图表说明:
上表中展示了训练集和测试集的预测评价指标,通过量化指标来衡量ExtraTrees回归的预测效果。
●MSE(均方误差):预测值与实际值之差平方的期望值。取值越小,模型准确度越高。
●RMSE(均方根误差):为MSE的平方根,取值越小,模型准确度越高。
●MAE(平均绝对误差):绝对误差的平均值,能反映预测值误差的实际情况。取值越小,模型准确度越高。
●MAPE(平均绝对百分比误差):是MAE的变形,它是一个百分比值。取值越小,模型准确度越高。
●R2:将预测值跟只使用均值的情况下相比,结果越靠近1模型准确度越高。
●oob_score:对于回归问题,oob_score是袋外数据的R2。若在建立树过程中选择有放回抽样时,大约1/3的记录没有被抽取。没有被抽取的自然形成一个对照数据集,可用于模型的验证。所以ExtraTrees不需要另外预留部分数据做交叉验证,其本身的算法类似交叉验证,而且袋外误差是对预测误差的无偏估计(当算法参数选择了“袋外测试数据”后,才会通过oob_score来检验模型的泛化能力)。
输出结果4:预测结果
预测测试集结果Y
风速
台风起始时间
台风结束时间
当前台风时间
经度
气压
移动速度
纬度
降水量
25
25
4
4
206
111.5
982
12
20.9
1.4000000000000001
23
23
4
4
172
113.5
985
3
20.5
1.7000000000000002
20.22
20
4
4
217
109.9
990
10
20.6
0.1
23
23
4
4
180
113.7
985
3
21
0.30000000000000004
23
23
4
4
170
113.4
985
4
20.5
0.4
22.91
23
3
3
68
111.8
990
20
19.3
0.8
24.96
25
4
4
186
113.5
982
12
21.1
1.1
28
28
4
4
243
106.3
982
10
19.7
0.6000000000000001
18.394000000000002
18
4
4
146
112.7
990
6
20.6
0.8
18.554000000000002
18
4
4
142
112.3
990
0
20.6
0.7000000000000001
22.91
23
3
3
67
112.1
990
20
19.6
1.3
22.97
23
3
3
59
113.8
990
20
19.3
0.30000000000000004
18.1725
18
4
4
135
112.2
990
0
21.1
0.4
28
28
4
4
236
107.3
982
15
19.9
0.9
18.2
18
3
3
86
107.9
991
10
19.3
0.2
图表说明:
上表格为预览结果,只显示部分数据,全部数据请点击下
您可能关注的文档
- 2024年MathorCup大数据竞赛论文模板.docx
- 2024年MathorCup大数据挑战赛论文格式及提交规范.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道B初赛.docx
- 2024年MathorCup大数据挑战赛-赛道B初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.docx
- Kendall一致性检验_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Pearson相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Spearman相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 描述性统计_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
最近下载
- 2025至2030中国有机冷冻蔬菜业行业项目调研及市场前景预测评估报告.docx
- 光宝ISA-7X标准泛用型伺服系统技术手册.pdf
- 大型羊场及配套沼气建设项目可行性研究报告书.doc VIP
- 2022-2023学年八年级英语下学期期末考点大串讲(牛津译林版):八年级英语下学期期末考试02(宿迁卷).pdf VIP
- 高中英语必背3500单词表(完整版).pdf VIP
- 催收评分技术及其在个人信贷催收管理中的应用.pdf VIP
- 土木工程测量-岳建平第1章绪论资料.ppt VIP
- 电磁场仿真软件:CST Microwave Studio二次开发_(6).材料属性设置.docx VIP
- 浙江省金华市十校联考2025-2026学年第一学期期末质量检测高一英语试题含答案.pdf
- 电磁仿真软件:CST Microwave Studio二次开发_(8).高级脚本应用:电磁建模与求解.docx VIP
原创力文档

文档评论(0)