- 6
- 0
- 约6.97万字
- 约 62页
- 2023-02-05 发布于江苏
- 举报
基于集成学习的二手车保值率分析
摘 要
近年来,我国经济发展迅速,人民生活水平也随之提高,汽车行业在此基础上
逐步壮大。汽车保有量的增加和现代人消费观念的转变,使得二手车市场不断发展
扩大,“互联网+ ”的浪潮更是进一步打响了二手车交易的热度。本文通过爬取人人
二手车网站10847 条数据来对二手车保值率进行下面两个方面的研究:第一,对二
手车保值率进行预估,进而可对二手车进行估价使买卖双方以公平合理的价格交易,
稳定市场秩序;第二,通过探究影响二手车保值率的因素,为二手车买卖双方提供
一些建议。
本文基于集成学习技术和Python 软件建立和改进二手车保值率回归预测模型。
首先对爬取的10847 条数据进行预处理,然后使用matplotlib 和seaborn 的绘图功能
以二手车保值率为因变量,以二手车使用状况因素、外部环境因素、汽车自身因素、
专业检测情况因素为自变量对二手车数据做描述性分析,探究四个自变量所包含的
各指标与保值率之间的关系并了解其数据分布规律。
其次,将全部样本按3 :1 划分为训练集和测试集,使用训练集建立RF 、GBDT、
XGBoost 三种集成学习模型,并使用测试集的2 、均方误差 MSE 、平均绝对误差
MAE 作为指标评价模型性能。通过对其进行优化调参,使各算法建立的模型达到最
优,对三种集成学习模型的原始效果和调参优化后的效果进行对比,发现调参能有
效提升模型的预测效果,且三种集成学习模型的预测效果都有不错的表现。另外,
使用 Stacking 模型融合的方式将上述三种集成学习模型作为基模型,
LinearRegression 作为元模型进行 Stacking,进一步提升了模型预测效果,体现了
Stacking 的优势。
最后,为探究二手车保值率的影响因素,将上述三种集成学习模型输出的特征
重要性程度及排名从以2为权重和以均方误差 MSE 为权重两个方面来分别输出最
终的影响因素排名,并将两种排名结果进行对比分析,探索出行驶里程、车龄、轴
距、整备质量、总异常数等与二手车保值率息息相关。
通过上述研究表明,利用集成学习技术建立的二手车保值率回归模型来探究二
手车保值率有较好的效果。
关键词:二手车保值率;集成学习;RF;GBDT ;XGBoost
目 录
摘 要 I
Abstract II
第1 章绪论 1
1.1 研究背景与研究意义 1
1.1.1 研究背景 1
1.1.2 研究意义 2
1.2 国内外研究现状 3
1.2.1 关于二手车的研究现状 3
1.2.2 关于集成学习的研究现状 5
1.3 研究内容及方法 7
1.3.1 研究内容 7
1.3.2 研究方法 8
1.3.3 本文主要创新点 8
第2 章 相关理论方法概述 10
2.1 集成学习综述 10
2.2 Bagging 方法介绍 11
2.2.1 Bagging 扩展变体-随机森林 12
2.3 Boosting 方法介绍 13
2.3.1 GBDT 14
2.3.2 XGBoost 16
2.4 Bagging 与Boosting 的区别 17
2.5 Stacking 18
第3 章 指标体系建立及描述性分析 21
3.1 指标体系的建立 21
3.1.1 数据来源 21
3.1.2 指标构成 21
3.1.3 数据预处理 23
3.2 二手车数据的描述性统计分析 26
3.2.1 二手车保值率分析 26
您可能关注的文档
- “仇恨的十年”_20世纪90年代美国“仇恨犯罪”研究.pdf
- “海派”乐人朱英琵琶艺术研究.pdf
- “江湖武汉”的想象与建构(1981-2021).pdf
- “三一语法”视角下双“了”构式的习得与教学研究.pdf
- “小立体”与“大平面”——构成形式在油画中的表现探究.pdf
- “移情”在中学语文教学中的应用研究.pdf
- 《城市风景系列》油画创作谈.pdf
- 《电子商务基础》课程情境教学应用研究——以XX中职学校为例.pdf
- 《静静的顿河》与《红高粱家族》的比较研究.pdf
- 《上新了·故宫》对中国传统文化记忆的建构.pdf
- 基于教材活动栏目下的地理核心素养落实——以人教2019版必修一为例.pdf
- 基于结构与功能观的《细胞的基本结构》一章的教学实践研究.pdf
- 基于聚邻氨基苯酚的固相微萃取涂层的电化学制备及其应用.pdf
- 基于科学论证促进“证据推理与模型认知”素养发展的研究.pdf
- 基于科学素养的小学《科学》单元主题教学实践研究——以“植物的一生”为例.pdf
- 基于三阶段DEA的长三角地区基层医疗卫生服务效率评价.pdf
- 基于数学建模思维的高中生物实验教学案例的研究——以“种群数量的变化”为例.pdf
- 基于数学实验室的高中生数学抽象能力的培养研究.pdf
- 基于碳包覆及碳点掺杂的荧光_光热双功能试剂的制备.pdf
- 基于微卫星DNA的扬子鳄野外放归个体筛选及圈养种群的遗传多样性预测.pdf
最近下载
- 穴位口诀大全.doc VIP
- IPC-7525C:2021 Stencil Design Guidelines 模板设计指导(钢网开孔标准 ) 英文 - .pdf VIP
- 八大穴位.doc VIP
- 第3课 “开元盛世”与唐朝经济的繁荣(任务型教学设计)历史统编版2024七年级下册.docx
- 穴位疗法口诀.doc VIP
- 湖北工程学院新技术学院《大学英语》2023-2024学年第一学期期末试卷.pdf VIP
- 基于单片机的的智能药盒的设计.doc VIP
- 《绿色低碳铝评价导则及追溯指南》T CNIA 0245-2024.docx
- 年产10万吨盐酸工艺设计大学生毕业设计(论文).doc VIP
- 2025华电笔试题及答案.docx VIP
原创力文档

文档评论(0)