CatBoost-1数学建模竞赛.docVIP

  • 0
  • 0
  • 约2.93千字
  • 约 4页
  • 2025-10-19 发布于甘肃
  • 举报

CatBoost基本信息汇总?MACROBUTTONDoFieldClick[]

选项

频数

百分比

有效

33

33.00%

缺失

67

67.00%

总计

100

100.00%

Suggestions?MACROBUTTONDoFieldClick[]

CatBoost是一种基于梯度提升的决策树(GradientBoostingDecisionTrees,GBDT)算法,专门优化了处理分类特征和序列数据的能力。算法步骤如下:

第一:生成初始模型,从简单的模型开始,通常是所有目标值的平均值;

第二:迭代构建树,计算当前模型的残差(即预测误差),使用残差构建一棵新的决策树,拟合这些残差,将这棵树加到模型中,以减少误差;

第三:更新模型,重复迭代,逐步增加决策树,直到达到预定的树数量或其他停止条件。

IntelligentAnalysis?MACROBUTTONDoFieldClick[]

将Totalnumberofhouseholds,Greeningrate,Floorarearatio,Propertymanagementfee(/m2/monthUSD),above-groundparkingfee(/monthUSD),undergroundparkingfee(/monthUSD),citycode,adcode,lon,lat,X,Y项作为自变量,而将Price(USD)作为因变量进行CatBoost建模,从上表可以看出,总共有33个样本参与分析。

特征权重值?MACROBUTTONDoFieldClick[]

权重值

Totalnumberofhouseholds

4.113

Greeningrate

6.989

Floorarearatio

8.051

Propertymanagementfee(/m2/monthUSD)

9.553

above-groundparkingfee(/monthUSD)

4.996

undergroundparkingfee(/monthUSD)

12.743

citycode

0.000

adcode

0.114

lon

21.949

lat

9.660

X

17.833

Y

4.002

IntelligentAnalysis?MACROBUTTONDoFieldClick[]

特征权重显示了各标题对模型贡献的重要程度,其加和值为1,从上表可知:

lon所占比重为2194.89%,该特征的权重最高,对模型构建起着关键作用;

X所占比重为1783.28%,该特征的重要性次之,对模型构建起着重要作用;

undergroundparkingfee(/monthUSD)所占比重为1274.26%;

以上3项特征的比重合计占到了5252.42%;

剩余9项lat、Propertymanagementfee(/m2/monthUSD)、Floorarearatio、Greeningrate、above-groundparkingfee(/monthUSD)、Totalnumberofhouseholds、Y、adcode、citycode的比重则分别为:965.97%、955.31%、805.08%、698.86%、499.57%、411.25%、400.16%、11.37%、0.00%。

模型评估结果?MACROBUTTONDoFieldClick[]

指标

说明

训练集时

测试集时

R方值

拟合程度指标,0~1之间越大越好

1.000

0.148

平均绝对误差值MAE

L1损失,真实值与拟合值的平均值差值,越接近于0越好

0.027

2101.776

均方误差MSE

L2损失,误差平方和均值,越接近于0越好

0.001

7639337.852

均方误差根RMSE

MSE开根号,平均gap值

0.031

2763.935

中位数绝对误差MAD

预测值离中位数残差的绝对值,不受异常值影响,越小越好

0.029

1495.592

平均绝对百分误差MAPE

平均误差百分比,不受异常点影响,越小越好

0.000

0.015

可解释方差分EVS

衡量模型对数据波动的解释力度,介于[0,1]之间,越大越好

1.000

0.179

均方根对数误差MSLE

在RMSE相同时,其对欠预测惩罚更多(使用较少)

0.000

0.064

Suggestions?MACROBUTTONDoFieldClick[]

模型评估结果指标用于评价模型的优劣和对比;

第一、默认提供包括8个评价指标,其中R方值、MAE、MSE、RMSE等4项指标使

文档评论(0)

1亿VIP精品文档

相关文档