山东临清三中数学选修2-3课件:3.1回归分析的基本思想第二课时(新人教A版选修2-3).pptVIP

山东临清三中数学选修2-3课件:3.1回归分析的基本思想第二课时(新人教A版选修2-3).ppt

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
山东临清三中数学选修2-3课件:3.1回归分析的基本思想第二课时(新人教A版选修2-3)

* 3.1 回归分析的基本思想 及其初步应用(二) 临清二中赵孝金 选修2-3之第三章《统计案例》 * 前置测评 1、 求回归直线方程 (最小二乘法): 为样本点的中心 * 2、我们通常用相关系数r来描述两个变量之间线性相关关系的强弱。 ★其中:(1)|r|≤1; (2)|r|越接近于1,相关程度越强, |r|越接近于0,相关程度越弱; (3) b 与 r 同号。 前置测评 * 3、线性回归模型: 其中:e是随机误差,均值E(e)=0,方差D(e)=σ20 当随机误差e恒等于0时,线性回归模型就变成一次函数模型。即:一次函数模型是线性回归模型的特殊形式。 4、相关系数r与随机误差e一般有什么关系? 前置测评 * 随机误差 e的估计量 样本点: 相应的随机误差为: 相应的随机误差估计值为: 称为相应于点 的残差 的估计量 为 称为残差平方和。 实际上即为具体到某 点的随机误差估计值。 * 残差分析 在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否是线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差 来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析。 * 0.382 -2.883 6.627 1.137 -4.618 2.419 2.627 -6.373 残差 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 下表为女大学生身高和体重的原始数据以及相应的残差数据: ? e 以纵坐标为残差,横坐标为编号,作出图形(残差图)来分析残差特性. * 由图可知,第1个样本点和第6个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他原因. * 问:如何刻画模型拟合的精度? 相关指数: (1)在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方. (2)R2取值越大(越接近1),则残差平方和越小,即模型的拟合效果越好.(实际上就是:|r|越大,则|e|越小) (3)在例1中我们可以求出R2=0.64,表明:“女大学生的身高解释了64%的体重变化”,或者说“女大学生的体重差异有64%是由身高引起的”。 ★其中: * 建立回归模型的基本步骤: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系); (3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程y=bx+a); (4)按一定规则估计回归方程中的参数(如最小二乘法); (5)得出结果后分析残差图是否异常(个别数据对应残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等. 是否存在线性关系 * 例2、一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表,试建立y与x之间的回归方程. 325 115 66 24 21 11 7 产卵数y/个 35 32 29 27 25 23 21 温度x/0C 解:收集数据作散点图: * 在散点图中,样本点没有分布在某个带状区域内,因此两个变量不呈现线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系. 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线 的周围,其中c1和c2是待定参数. 令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围. 利用线性回归模型建立y和x之间的非线性回归方程. 当回归方程不是形如y=bx+a时,我们称之为非线性回归方程. * 5.784 4.745 4.190 3.178 3.045 2.398 1.946 z 35 32 29 27 25 23 21 X 所得线性回归方程为: a=lnc1,b=c2 所以红铃虫的产卵数对温度的非线性回归方程为: * 若看成样本点集中在某二次曲线y=c3x2+c4的附近. 作变换t=x2,建立y与t之间的线性回归方程:y=c3t+c4. 还可以拟合成什么函数模型? * 325 115 66 24 21 11 7 y 1225 1024 841 729 625 529 441 t y关于x的二次回归方程为: * 利用

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档