- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
西安汽车职业大学计算机工程学院
实训地点:知行楼409大数据技术实验室
实训名称:二手车保值率影响因素分析
实训日期:2024.11.23—2024.12.7
专业:大数据工程技术报告日期:2024.12.7
同组学生:
实训过程:
1.实训目的和要求
实验目的:
本课程旨在探讨二手车保值率和升功率的预测与价值分析,通过分析二手车市场发展现状
及存在的问题,另外又额外增加了升功率的一些考察从省油,环保层面考虑汽车的整体性能等
方面(Power-to-displacementratio)升功率是指发动机每单位排量所能产生的最大马力数,
通常以马力/升(hp/L或kW/L)为单位。这个指标是衡量发动机性能的一个重要参数,它反映
了发动机的设计效率和技术水平。通过保值率和升功率引导学习者构建完整的建模流程,从数
据收集到模型预测,最终探讨预测结果对消费者购车决策的影响。
实训要求:
(1)理解二手车市场的发展现状和存在的问题,包括市场成熟度、交易方式、价值损耗等方
面;
(2)掌握建模流程的关键步骤,包括数据收集、预处理、特征选择、模型构建等;
(3)使用回归算法进行模型建立,预测二手车的保值率;
(4)分析预测结果对消费者购车决策的影响,探讨如何优化二手车交易,提高车辆的保值
率,从而为消费者提供更有价值的购车选择。
(5)使用不同的回归方法,事实证明线性回归方法更加清晰。
西安汽车职业大学计算机工程学院
2.实训内容和基本理论
实训内容:
为了解各属性的数据特征,以及是否存在缺失值,我们首先对数据进行描述性统计分析;
接下来,导入数据集生成一个新的属性升功率,可视化各属性对二手车保值率和升功率的影
响;对数据进行拆分,在训练集上构建线性回归模型,根据训练集和测试机的R方和误差等标
准评估灰灰模型的准确性,并分析模型对消费者在购买二手车时能提供哪些意义。
基本理论:
1.回归算法:
(1)回归就是用属性的历史教据预测末来的趋势。回归首先假设一些已知类型的函数可以拟
合目标数据,然后利用某种误差分析确定一个与目标数据拟合程度最好的函数。回归模式的函
数定义与分类模型相似,主要差别在于分类模型采取离散预测值(例如类标号),而回归模式采
取连续的预测值。
(2)回归算法在解决实际问题时经常会把数据拆分为两个数据集:训练数据集,测试数据
集。通过数据挖掘算法对训练数据集进行建模,寻找X和Y之间的数学模型,然后通过测试数
据集来验证该数学模型的准确率,如果误差能够达控制到-定精度,则认为该模型很好的反映了
X和Y的关系,可以用来进行预测和分析。
2.线性回归:
(1)基本概念
线性回归算法是一种很常用的回归算法。其主要思想是:首先假设线性函数可以拟合目标
数据,然后利用某种误差分析确定一个与目标数据拟合程度最好的函数,即完成了线性回归算
法。实际的挖掘过程中,许多问题可以用线性回归算法解决,许多非线性问题可以通过变量进
行变换,从而转换成线性回归问题来解决。
(2)算法优缺点
线性回归算在分析多个因素模型,更加简单方便。
线性回归适合分布式实现,能支持大数据量建模,以及支持名词型和数值型数据。
线性回归能通过正则化来降低过拟合的风险。
线性回归在变量是非线性关系的时候表现很差。
不够灵活以捕捉更复杂的模式,添加正确的交互或者使用多项式很困难并需要大是的时间。
西安汽车职业大学计算机工程学院
3.操作步骤
数据说明
步骤一:数据读取
本案例数据在mysql数据库中,所以在关系数据库中输入数据源二手车数据进行数据读取
并测试sql读取语句是否成功。
步骤二:描述性分析
找出数据的内在规律,查看是否存在缺失
文档评论(0)