- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汽车油耗问题
统计案例16-2 by G2/09P1 汽车油耗问题(案例16-2) 案例概要 分析230组在美国市场销售由不同厂商,型号,排量,技术类别等的数据组成的关于汽车 城市(Cty)及公路(Hwy)油耗的数据,找出与油耗有回归关系的因素,并建立回归方程,并且用得出的数据分析最后的结论 现实生活中,大家对于与油耗相关车本身的客观因素的认识一般是: 排量越大油耗越大; 车体越大油耗越大; 同级车厂,美国车欧洲车日本车; 变速器,自动手动; 城市大于高速公路; 激烈驾驶的油耗要比稳定驾驶大很多; 越先进的发动机越省油… 那么统计结果呢? 2010/5/7 * 统计案例16-2 by G2/09P1 案例问题 A.建立城市和公路油耗回归方程 分析结论/检验结论 2010/5/7 * 统计案例16-2 by G2/09P1 案例中涉及多个描述性变量: 汽车的类型—大中小 汽车制造商—涵盖世界主要汽车生产厂家 汽车的名称—名目繁多 变速器类型—手动,自动 案例核心问题 如何设置符合实际情况的虚拟变量? 如何用恰当的虚拟变量来表达具统计意义的回归方程? 2010/5/7 * 统计案例16-2 by G2/09P1 方案---数据整理,变量分析 将车型按大中小分类,引入两个虚拟变量: 紧凑型车(Compact)和中型车(Midsize), 分别用0表示非,1表示是; (0,0)代表皆非,即大型车(Large) 将汽车制造商(Manufacturer)按区域品牌归属分为四大块—欧,美,日,韩 (注:这里考虑到日韩车系差别巨大,为了能更准确体现最终结果,因此细化分开),同上方式引入三个虚拟变量: 欧,日,美; (0,0,0)皆非表示韩国产车 引入一个代表变速箱(Transmission)的虚拟变量: 0表示手动, 1表示自动 2010/5/7 * 统计案例16-2 by G2/09P1 方案---数据整理,变量分析 考虑到汽车的气缸数(Cylinder)既可看作数值变量,也可视为虚拟变量,并与排量(Displacement)高度相关,都作为数值引入进行检验 汽车名称(Carline name)属于与油耗非相关因素,不会影响最终回归结果,舍去 得出方程初步模型为: 油耗=β0+β1小型车+β2中型车+β3欧洲品牌+β4日本品牌+ β5美国品牌+ β6变速箱 +β7汽缸数+β8排量 F检验: 假设H0=β0=β1=β2=β3=β4=β5=β6=β7=β8 Hα:所有系数至少有一个不等于0 如果P<=0.05 则拒绝 H0 , 因变量和自变量间存在回归关系 2010/5/7 * 统计案例16-2 by G2/09P1 方案---数据整理,变量分析 最终数据样式: 共230组数据,接下来我们需要做的就是把整理好的数据使用SPSS进行逐步回归分析 所有变量需作共线性分析 2010/5/7 * 统计案例16-2 by G2/09P1 方案1---城市油耗变量验证 根据最后得出的结果可以知道由排量,日本品牌,中型车这三个变量以及常量组成的 方程与城市油耗存在回归关系 2010/5/7 * 统计案例16-2 by G2/09P1 方案1---城市油耗变量验证 初步得出回归方程: 城市油耗=32.503 - 3.880×发动机排量 + 2.125×日本品牌 - 1.522×中型车 2010/5/7 * 统计案例16-2 by G2/09P1 方案1---城市油耗变量验证 剔除过程显示 2010/5/7 * 统计案例16-2 by G2/09P1 方案1---城市油耗变量验证 残差分析显示: 99.3%的标准化残差介于-2和+2之间; 标准化残差呈标准正态概率分布。 2010/5/7 * 统计案例16-2 by G2/09P1 方案1---城市油耗变量验证 需要注意的预测值跟实际值 偏差异常超过两个标准差的数据,经检查,发现里面有三款(45,46,111)都属于日本的油电混合动力汽车(油耗特低),而82三菱的属于一款极其运动的改装车,真正属于异常是剩余4款大众紧凑型汽车 2010/5/7 * 统计案例16-2 by G2/09P1 方案1---城市油耗变量验证 2010/5/7 * 统计案例16-2 by G2/09P1 如果我们忽略车厂间的差别,则可以有如下结果 方案1---城市油耗变量验证 2010/5/7 * 统计案例16-2 by G2/09P1 得出回归方程: 城市油耗=33.537 – 4.066×发动机排量 - 1.291×中型车 说明影响城市油耗的因素跟我们实际感受的是一致的 方案1---城市油耗变量验证 2010/5/7 * 统计案例16
文档评论(0)