- 0
- 0
- 约3.94千字
- 约 10页
- 2025-10-19 发布于甘肃
- 举报
分析流程
数据源:
Appendix1-ChangchunCity.xlsx
算法配置:
算法:决策树回归
分析结果:
决策树回归基于MSE、RMSE、MAE、MAPE、R2指标对模型进行评价,请看详细结论。
分析步骤
1.通过训练集数据来建立决策数回归模型,得到决策树结构。
2.通过建立的决策树来计算特征重要性。
3.将建立的决策树回归模型应用到训练、测试数据,得到模型评估结果。
4.由于决策树具有随机性,每次运算的结果不一样,若保存本次训练模型,后续可以直接上传数据代入到本次训练模型进行计算预测。
5.注:决策树无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。
详细结论
输出结果1:模型参数
参数名
参数值
训练用时
0.164s
数据切分
0.8
数据洗牌
是
交叉验证
10
节点分裂评价准则
friedman_mse
特征划分点选择标准
best
划分时考虑的最大特征比例
None
内部节点分裂的最小样本数
2
叶子节点的最小样本数
1
叶子节点中样本的最小权重
0
树的最大深度
10
叶子节点的最大数量
50
节点划分不纯度的阈值
0
图表说明:
上表展示了模型各项参数配置以及模型训练时长。
输出结果2:决策树结构
图表说明:
上图展示了决策树结构,内部节点给出了被分枝特征的具体切分情况,即根据某个特征的某个切分值进行划分。
(若节点数大于30,点击下载按钮查看决策树结构)
●mse/friedman_mse/mae等用以确定对哪一个特征进行切分。
●样本数量是该节点拥有的样本数量。
●节点样本均值是该节点全部样本的均值。
PS:特别注意的是,若节点数大于30,系统提供下载按钮查看决策树结构;若节点数大于2000,由于树结构渲染模糊,系统不提供下载导出。
输出结果3:特征重要性
图表说明:
上柱形图或表格展示了各特征(自变量)的重要性比例。
输出结果4:模型评估结果
MSE
RMSE
MAE
MAPE
R2
训练集
4462225.57
2112.398
1277.496
17.872
0.579
交叉验证集
6961901.446
2599.085
1479.925
19.914
0.352
测试集
5710128.159
2389.587
1487.611
20.173
0.402
图表说明:
上表中展示了交叉验证集、训练集和测试集的预测评价指标,通过量化指标来衡量决策树的预测效果。其中,通过交叉验证集的评价指标可以不断调整超参数,以得到可靠稳定的模型。
●MSE(均方误差):预测值与实际值之差平方的期望值。取值越小,模型准确度越高。
●RMSE(均方根误差):为MSE的平方根,取值越小,模型准确度越高。
●MAE(平均绝对误差):绝对误差的平均值,能反映预测值误差的实际情况。取值越小,模型准确度越高。
●MAPE(平均绝对百分比误差):是MAE的变形,它是一个百分比值。取值越小,模型准确度越高。
●R2:将预测值跟只使用均值的情况下相比,结果越靠近1模型准确度越高。
输出结果5:预测结果
预测测试集结果Y
Price(USD)
Totalnumberofhouseholds
Greeningrate
Floorarearatio
Propertymanagementfee(/m2/monthUSD)
above-groundparkingfee(/monthUSD)
undergroundparkingfee(/monthUSD)
lon
lat
X
Y
5847.94902287046
7170.504670866826
717.0868022705771
0.302082960199005
1.6699256136870815
22.4568489713999
184.1085154483798
326.41092896174865
125.155092
43.821058
54.63486340936141
26.505287097194167
8276.590969751516
6300
416
0.2
1.2
16
100
326.41092896174865
125.452381
43.808758
71.20771979231256
25.819603693131622
6933.569337874643
6500
48
0.3
1.2
16
150
326.41092896174865
125.327701
43.895445
64.25723143308545
30.652110786461463
3677.432219223277
6300
66
0.3
原创力文档

文档评论(0)