- 0
- 0
- 约10.52万字
- 约 80页
- 2026-01-21 发布于江西
- 举报
摘要
在经济增长和政策支持的推动下,我国二手车市场显示出巨大的发展潜力。相
比于新车,二手车凭借价格优势为消费者提供了更具性价比的选择,交易量逐年增
长。然而,市场扩张的同时也带来了许多挑战,如二手车评估标准不统一、卖方信
息不透明、平台定价策略不明确等,严重打击了消费者的信心,阻碍市场的进一步
发展。本文利用大数据和机器学习技术,分析影响二手车价格的关键因素并构建价
格评估模型,旨在为二手车定价提供科学依据,促进二手车市场的可持续发展。
本研究利用网络爬虫从瓜子二手车网站上爬取二手车交易数据并进行分析。在
数据预处理阶段,本文进行了重复值、缺失值、异常值的处理和数据变换的操作。
通过运用可视化技术来进一步探讨各变量与二手车交易价格之间的关系,并引入销
售延迟、成交价差值以及车辆空间特征这三个新变量来拓展数据分析的维度。接着,
本文综合应用方差法、相关系数法、递归特征消除法、Lasso回归以及基于树模型
的特征选择法,共选取14个关键变量。基于此,本文构建了K近邻(KNN)、支持
向量回归(SVR)、随机森林、极端随机树、XGBoost、LightGBM以及DNN等多种
单一模型,并将随机搜索和五折交叉验证进行结合来确定各模型的最优超参数。通
过MAE、MSE、RMSE、MAPE和决定系数这五个评价指标来对这七种模型的预测
表现进行评估,并将表现优异的模型用于Stacking集成,以进一步提高预测精度。
基于不同模型的预测精度及其相互间的关联性,本文将KNN、SVR、随机森林、
XGBoost和DNN模型作为基学习器,以线性回归为元学习器构建传统Stacking集
成模型。在此框架的基础上,本文根据每个基学习器的预测精度对其预测结果进行
加权,进一步构建特征加权Stacking集成模型。通过对比分析,Stacking集成模型
的预测表现优于单一预测模型,展现了更低的误差与更高的决定系数。且与传统
Stacking模型相比,特征加权Stacking集成模型在MAE、MSE、RMSE和MAPE
等指标上分别降低了6.0538%、19.1304%、10.1184%和0.6988%,同时决定系数提
升了1.0377%,标志着其作为最优模型的显著优势。
本文构建的价格评估模型,不仅证实特征加权Stacking集成模型的实用性,同
时也为二手车价格预测领域提供了新的研究视角。该模型可以指导商家构建二手车
价格评估体系,并为消费者提供价格参考,以推动二手车市场的健康持续发展。
关键词:二手车价格预测;Stacking集成模型;特征加权
Abstract
Drivenbyeconomicgrowthandpolicysupport,Chinasusedcarmarkethasshown
greatpotentialfordevelopment.Comparedwithnewcars,usedcarsprovideconsumers
withmorecost-effectiveoptionsbyvirtueoftheirpriceadvantages,andthevolumeof
transactionsisgrowingyearbyyear.However,theexpansionofthemarkethasalso
broughtmanychallenges,suchasinconsistentevaluationstandardsforusedcars,opaque
sellerinformation,andunclearpricingstrategiesforplatforms,whichhaveseriously
underminedconsumerconfidenceandhinderedthefurtherdevelopmentofthemarket.In
thispaper,weusebigdataandmachinelearningtechnologyto
原创力文档

文档评论(0)