2017年安徽省滁州二中高中数学 回归分析的基本思想及其初步应用课件 新人教A版选修1-2.pptVIP

2017年安徽省滁州二中高中数学 回归分析的基本思想及其初步应用课件 新人教A版选修1-2.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2017年安徽省滁州二中高中数学 回归分析的基本思想及其初步应用课件 新人教A版选修1-2.ppt

表1-4列出了女大学生身高和体重的原始数据以及相应的残差数据。 在研究两个变量间的关系时,首先要根据散点图来粗略判断 它们是否线性相关,是否可以用回归模型来拟合数据。 残差分析与残差图的定义: 然后,我们可以通过残差 来判断模型拟合 的效果,判断原始数据中是否存在可疑数据,这方面的分析 工作称为残差分析。 编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 残差 -6.373 2.627 2.419 -4.618 1.137 6.627 -2.883 0.382 残差图的制作及作用: 坐标纵轴为残差变量,横轴可以有不同的选择; 若模型选择的正确,残差图中的点应该分布在以横轴为中心的带形区域; 对于远离横轴的点,要特别注意。 身高与体重残差图 异常点 错误数据 模型问题 几点说明: 第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。 必修3(第二章 统计)知识结构 收集数据 (随机抽样) 整理、分析数据估计、推断 简单随机抽样 分层抽样 系统抽样 用样本估计总体 变量间的相关关系 用样本的频率分布估计总体分布 用样本数字特征估计总体数字特征 线性回归分析 1、两个变量的关系 不相关 相关关系 函数关系 线性相关 非线性相关 问题1:现实生活中两个变量间的关系有哪些呢? 相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。 思考:相关关系与函数关系有怎样的不同? 函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况 问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢? 2、最小二乘法估计 最小二乘法估计下的线性回归方程: 如何描述两个变量之间线性相关关系的强弱? 在《数学3》中,我们学习了用相关系数r来衡量两个变量 之间线性相关关系的方法。 相关系数r 相关关系的测度 (相关系数取值及其意义) -1.0 +1.0 0 -0.5 +0.5 完全负相关 无线性相关 完全正相关 负相关程度增加 r 正相关程度增加 对回归模型进行统计检验 假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相同。在体重不受任何变量影响的假设下,设8名女大学生的体重都是她们的平均值, 即8个人的体重都为54.5kg。 54.5 54.5 54.5 54.5 54.5 54.5 54.5 54.5 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 思考P5: 预报变量(体重)的变化在多大程度上与解释变量(身高) 有关?在多大程度上与随机误差有关? 在散点图中,所有的点应该落在同一条水平直线上,但是观测到的数据并非如此。这就意味着预报变量(体重)的值受解释变量(身高)或随机误差的影响。 54.5kg 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 例如,编号为6的女大学生的体重并没有落在水平直线上, 她的体重为61kg。解释变量(身高)和随机误差共同把这 名学生的体重从54.5kg“推”到了61kg,相差6.5kg,所以 6.5kg是解释变量和随机误差的组合效应。 用这种方法可以对所有预报变量计算组合效应。 数学上,把每个效应(观测值减去总的平均值)的平方加 起来,即用 表示总的效应,称为总偏差平方和。 在例1中,总偏差平方和为354。 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 那么,在这个总的效应(总偏差平方和)中,有多少来自于 解释变量(身高)?有多少来自于随机误差? 在例1中,残差平方和约为128.361。 因此,数据点和它在回归直线上相应位置的差异

文档评论(0)

专注于电脑软件的下载与安装,各种疑难问题的解决,office办公软件的咨询,文档格式转换,音视频下载等等,欢迎各位咨询!

1亿VIP精品文档

相关文档