2021年MathorCup大数据竞优秀论文3.pdfVIP

  • 1
  • 0
  • 约2.53万字
  • 约 23页
  • 2025-10-18 发布于甘肃
  • 举报

队伍编号MCB2100593

赛道A

基于Stacking模型的二手车价格预测

摘要

随着机动车数量的增长,二手车交易的市场蓬勃发展。为了帮助二手车交易平台解

决二手车定价问题以及加快销售速度的问题。本文建立基于Stacking技术和贝叶斯优化

的模型,将估价模型进行融合,提出了更准确的二手车的估价策略;建立基于XGBoost

模型,对影响交易周期的关键因素进行研究。

针对问题一,主要需要确定影响成交价格的因素并建立合适的预测模型。本文建立

StackingXGBoostLightGBMCatBoost

了基于技术的、和融合模型来进行估价,并运用

贝叶斯优化进行模型超参数调优。首先,我们对数据进行异常值剔除、正态转换和缺省

28

值填补的预处理,构造出便于统计分析的特征,选取与成交价格有密切关系的个特

征并做检验。基于所选特征利用Stacking融合技术的模型对成交价格进行预测,在此过

HEROXGBoostLightGBMCatBoost

程中用算法对基模型、和进行贝叶斯优化,最终得

到训练模型。依据此训练模型在验证集上所得预估价格的评测值为0.5324,且优于单一

模型评测效果。

针对问题二,主要需要研究影响交易周期的关键因素以及改善策略。本文建立了

XGBoost模型来提取关键因素并进行分析。在第一问数据预处理的基础上,选取与成交

29XGBoost

周期有关的个特征。基于所选特征利用算法确定影响交易周期的关键因素

12

有:降价比率、评估方法、评估方法、里程、定价、新车价、车辆所在城市交易价

格总值。根据上述因素在收车、定价、维修保养方面提出了促进销售速度加快的方法。

针对问题三,由于二手车交易“一车一况”的特性,我们期望在原有数据集的基础

上获得更多能够衡量车辆老旧损伤程度的特征。因此建议车辆在定价之前做一次全面的

检测,从而得到车辆老旧损耗程度的特征,便于我们预估价格。另外,不同于车辆的市

场特征以及性能特征,二手车的车系车型对成交价格的影响不具有明显的统计规律,我

们建议采用图嵌入方式研究其对价格的影响。

关键词:数据预处理、HEBO算法、Stacking技术、XGBoost模型

目录

一、问题重述1

1.1问题的背景1

1.2问题的提出1

二、问题的分析2

2.1问题一的分析2

2.2问题二的分析2

2.3问题三的分析2

三、模型的假设3

四、基于Stacking模型的二手车价格预测3

4.1数据处理3

4.2特征构造5

4.3特征筛选6

4.4模型选择8

4.4.1XGBoost模型8

4.4.2LightGBM模型8

4.4.3CatBoost模型9

4.4.4Stacking技术9

4.5基于贝叶斯框架的超参数调优10

4.5.1HEBO算法11

4.5.2优化流程12

4.5.3HEBO优化结果12

4.6实验结果13

五、基于XGBoost的关键因素挖掘14

5.1数据处理14

5.2特征构造14

5.3关键因素挖掘15

5.4销售建议16

六、问题拓展18

6.1二手车车况信息研究18

6.2图嵌入研究车系车型对车辆价

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档