- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高二必修③统计变量间的相关关系
* * * 温州二中黄龙校区 张启津 (一)统计思想再认识 回顾1:请大家回顾十来年数学学习历程,我们经历了哪些有关统计知识? 初中八,九年级的平均数 数与标准差 高一必修①的函数模型 及其应用(直接选择函数) 高二必修③统计,变量间的 相关关系(线性相关,相关强度r在阅读中介绍) 高二选修2-3 回归分析的基本思想及其初步应用 独立性检验的基本思想及其初步应用 回顾2:请回顾用统计的方法研究问题的基本过程。 收集数据(随机抽样) 整理、分析数据 用样本去估计总体(数字特征、图形特征) 研究变量的相关关系(回归直线) 探究:如果我们要研究身高和体重之间的关系, 你会怎么做? 收集数据 列表 画散点图 粗略估计身高和体重的相关关系 求回归方程 对回归方程进行分析 (二)回归方程的建立 假设我们现在收集到一批学生的数据如下: 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 现在我们想知道身高为172CM的学生的体重,应该怎么做? 最小二乘法估计: 得到回归方程: 将172代入上式得到 (三)线性回归模型的建立 问题1:大家如何理解我们求出的回归直线方程以及预测值 (1)由于不同的样本计算出的斜率和截距是不同的,因此我们求出回归直线的斜率和截距具有随机性。 (2)不同的方法求出的斜率和截距也会不同,目前最小二乘法是最好的估计方法。 (3)结合这两点,由公式得到是斜率和截距的估计值。 (4)故所得到预测值不是精确的,一般可以认为她的体重大约在60.316 。 (三)线性回归模型的建立 问题2:请大家计算编号为6的女大学生的体重,你有什么发现? 问题3:它与真实值61kg不同,产生这种误差的原因是什么呢? (1)我们无法知道身高与体重之间的确切关系,因此用线性 回归方程 来近似这种关系。而线性模拟不一 定是最好的模拟。 (2)事实上,一个人的体重除受身高影响外,还受其它的因素,如:饮食习惯、是否喜欢运动、度量误差等的影响。 这些因素所引起的误差是不可观测的,我们把这些因素(除了身高以外的随机因素)所引起的误差总和记为 它是一个随机变量 问题4:有了这个误差 以后,大家可以建立一个模型来表示身高和体重之间的关系吗? 其中 称为随机误差 问题5:能说明它与一次函数模型 的区别吗? 解释变量 预报变量 (四)回归分析 问题1. 利用统计的思想,如何求随机误差 ? 对于样本点: 它们相应的随机误差的估计值为 问题2:为了研究模型拟合的效果,通过研究什么是关键? 0.382 -2.883 6.627 1.137 -4.618 2.419 2.627 -6.373 残差 59 43 61 64 54 50 57 48 体重 170 155 165 175 170 157 165 165 身高 8 7 6 5 4 3 2 1 编号 问题3:小组讨论,用什么方法使这些数据变得更直观?它能给我们一些什么信息? (四)回归分析 残差图 通常以样本编号、身高数据等作为横坐标。残差作为纵坐标。 (1)有些样本点的残差比较大,考虑样本点的采集是否有人为错误。 (2)残差点应该比较均匀地落在水平的带状区域中,这个带状区域越窄,说明拟合效果越好。 (四)回归分析 残差分析 * *
文档评论(0)