3.1《回归分析的基本思想及其初步应用》课件.pptxVIP

3.1《回归分析的基本思想及其初步应用》课件.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
选修2-3 1、两个变量的关系 不相关 相关关系 函数关系 线性相关 非线性相关 问题1:现实生活中两个变量间的关系有哪些? 相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。 2、现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等 探索:水稻产量y与施肥量x之间大致有何规律? 10 20 30 40 50 500 450 400 350 300 · · · · · · · 发现:图中各点,大致分布在某条直线附近。 探索2:在这些点附近可画直线不止一条, 哪条直线最能代表x与y之间的关系呢? 施化肥量 水稻产量 散点图 最小二乘法: 称为样本点的中心。 1、已知回归直线斜率的估计值为1.23,样本点的 中心为(4,5),则回归直线方程为( ) C 练习:2、某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程y = 0.66x + 1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为…………( ) A.83% B.72% C.67% D.66% A 问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢? 2、最小二乘估计 最小二乘估计下的线性回归方程: 问题一:结合例1得出线性回归模型及随机误差。并且区分函数模型和回归模型。 由于所有的样本点不共线,而只是散布在某一直线的附近,所以身高和体重的关系可以用线性回归模型来表示: 函数模型与“回归模型”的关系 函数模型:因变量y完全由自变量x确定 回归模型: 预报变量y完全由解释变量x和随机误差e确定 问题二:在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应如何研究随机误差呢? 结合例1除了身高影响体重外的其他因素是不可测量的,不能希望有某种方法获取随机误差的值以提高预报变量的估计精度,但却可以估计预报变量观测值中所包含的随机误差,这对我们查找样本数据中的错误和模型的评价极为有用,因此在此我们引入残差概念。 问题三:如何发现数据中的错误?如何衡量随机模型的拟合效果? (1)我们可以通过分析发现原始数据中的可疑数据,判断建立模型的拟合效果。 残差图的制作和作用: 制作:坐标纵轴为残差变量,横轴可以有不同的选择. 横轴为编号:可以考察残差与编号次序之间的关系, 横轴为解释变量:可以考察残差与解释变量的关系, 作用:判断模型的适用性若模型选择的正确,残差图中的点应该分布在以横轴为中心的带形区域. 下面表格列出了女大学生身高和体重的原始数据以及相应的残差数据。 残差图的制作及作用。 坐标纵轴为残差变量,横轴可以有不同的选择; 若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域; 对于远离横轴的点,要特别注意。 几点说明: 第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。 注:相关指数R2是度量模型拟合效果的一种指标。在线性模型中, 它代表自变量刻画预报变量的能力。 问题四:若两个变量呈现非线性关系,如何解决?(分析例2) 例2 一只红铃虫的产卵数y和温度x有关。现收集了7组观测数据列于表中: (1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了产卵数的变化? 方法一:一元函数模型 产卵数 气温 变换 y=bx+a 非线性关系 线性关系 对数 方法三:指数函数模型 最好的模型是哪个? 显然,指数函数模型最好!

文档评论(0)

tianebandeyazi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档