决策树回归_(经度-台风起始时间-台风结束时间-纬度-当前台风时间-气压-移动速度-降水量-台风强度)_(风速).docxVIP

  • 0
  • 0
  • 约2.42千字
  • 约 7页
  • 2025-10-18 发布于甘肃
  • 举报

决策树回归_(经度-台风起始时间-台风结束时间-纬度-当前台风时间-气压-移动速度-降水量-台风强度)_(风速).docx

分析流程

数据源:

贝碧嘉.xlsx

算法配置:

算法:决策树回归

分析结果:

决策树回归基于MSE、RMSE、MAE、MAPE、R2指标对模型进行评价,请看详细结论。

分析步骤

1.通过训练集数据来建立决策数回归模型,得到决策树结构。

2.通过建立的决策树来计算特征重要性。

3.将建立的决策树回归模型应用到训练、测试数据,得到模型评估结果。

4.由于决策树具有随机性,每次运算的结果不一样,若保存本次训练模型,后续可以直接上传数据代入到本次训练模型进行计算预测。

5.注:决策树无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。

详细结论

输出结果1:模型参数

参数名

参数值

训练用时

0.017s

数据切分

0.7

数据洗牌

交叉验证

10

节点分裂评价准则

friedman_mse

特征划分点选择标准

best

划分时考虑的最大特征比例

None

内部节点分裂的最小样本数

2

叶子节点的最小样本数

1

叶子节点中样本的最小权重

0

树的最大深度

10

叶子节点的最大数量

50

节点划分不纯度的阈值

0

图表说明:

上表展示了模型各项参数配置以及模型训练时长。

输出结果2:决策树结构

图表说明:

上图展示了决策树结构,内部节点给出了被分枝特征的具体切分情况,即根据某个特征的某个切分值进行划分。

(若节点数大于30,点击下载按钮查看决策树结构)

●mse/friedman_mse/mae等用以确定对哪一个特征进行切分。

●样本数量是该节点拥有的样本数量。

●节点样本均值是该节点全部样本的均值。

PS:特别注意的是,若节点数大于30,系统提供下载按钮查看决策树结构;若节点数大于2000,由于树结构渲染模糊,系统不提供下载导出。

输出结果3:特征重要性

图表说明:

上柱形图或表格展示了各特征(自变量)的重要性比例。

输出结果4:模型评估结果

MSE

RMSE

MAE

MAPE

R2

训练集

0

0

0

0

1

交叉验证集

0.424

0.513

0.18

0.861

0.967

测试集

0.5

0.707

0.133

0.659

0.968

图表说明:

上表中展示了交叉验证集、训练集和测试集的预测评价指标,通过量化指标来衡量决策树的预测效果。其中,通过交叉验证集的评价指标可以不断调整超参数,以得到可靠稳定的模型。

●MSE(均方误差):预测值与实际值之差平方的期望值。取值越小,模型准确度越高。

●RMSE(均方根误差):为MSE的平方根,取值越小,模型准确度越高。

●MAE(平均绝对误差):绝对误差的平均值,能反映预测值误差的实际情况。取值越小,模型准确度越高。

●MAPE(平均绝对百分比误差):是MAE的变形,它是一个百分比值。取值越小,模型准确度越高。

●R2:将预测值跟只使用均值的情况下相比,结果越靠近1模型准确度越高。

输出结果5:预测结果

预测测试集结果Y

风速

经度

台风起始时间

台风结束时间

纬度

当前台风时间

气压

移动速度

降水量

台风强度

23

23

114.5

3

3

19.1

56

990

20

0.2

2

15

15

111.6

4

4

20.9

123

998

14

1.2000000000000002

1

20

20

106.8

3

3

19.7

99

990

8

1.8

2

28

28

107.9

4

4

19.9

231

982

15

0.9

3

28

28

107.3

4

4

19.9

236

982

15

0.9

3

25

25

110.8

4

4

20.9

212

982

10

1.5

3

23

23

112.1

3

3

19.6

67

990

20

1.3

2

18

18

108.2

3

3

19.1

84

991

10

0.5

2

23

23

111.8

3

3

19.3

68

990

20

0.8

2

28

28

107.4

4

4

19.9

235

982

13

0.9

3

23

23

113.7

4

4

20.9

179

985

4

1.8

2

18

18

112.1

4

4

20.9

138

990

0

1.6

2

23

23

113.7

4

4

20.9

178

985

3

0.4

2

18

18

107.9

3

3

19.3

86

991

10

0.2

2

20

20

113.3

4

4

20.6

160

990

0

1.1

2

图表说明:

上表格为预览结果,只显示部分数据,全部数据请点击下载按钮导出。

上表展示了决策树模型对测试数据的分类结果,分类结果值是拥有最大预测概率的分类组别。

输出结果6:测试数据预测图

图表说明:

上图中展示了决策树对测试数据的预测情况。

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档