- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
探究(二):残差分析 思考1:随机误差e是随机变量,其均值为0,因此可以用方差σ2来衡量随机误差的大小,进而衡量预报的精度.能否从预报变量y中精确提取随机变量e的样本? 由于参数a,b是未知的,所以不能精确提取样本. 思考2:由样本数据可以建立回归方程 ,所得 是 的估计量,那么随机误差 可用哪个量来估计? 思考3:对于样本点(x1,y1),(x2,y2),…,(xn,yn),相应的随机误差为ei(i=1,2,…,n)等于什么?其估计值 等于什么? 思考4:上述 称为相应于点(xi,yi)的残差,类比样本方差估计总体方差的思想,可以用 (n>2) 作为σ2的估计值, 称为残差平方和.当样本容量为1或2时残差平方和为多少? 残差平方和为0,但不能认为预报误差为0. 思考5:在研究两个变量间的相关关系时,先要根据散点图直观判断它们是否线性相关,再通过残差来判断模型的拟合效果,判断原始数据中是否存在可疑数据,这些分析工作称为残差分析.在残差分析中,计算各样本点残差估计值的步骤如何? 先求参数 , 的值,再利用 求残差估计值. 思考6:利用图形可以直观分析残差特性,作图时纵坐标为残差,横坐标可以是样本编号,或样本中其它数据,所得的图形称为残差图.那么回归模型拟合精度越高,残差图有什么特性? 残差点较均匀地散布在水平带状区域中,且带状区域宽度较窄. 理论迁移 例 从某大学中随机选取8名女大学生,其身高和体重数据如表所示: 试计算各组数据的残差,并画出残差图. 59 43 61 64 54 50 57 48 体重kg 170 155 165 175 170 157 165 165 身高cm 1 编号 2 3 4 5 6 7 8 残差 0.382 -2.883 6.627 1.137 -4.618 2.410 2.627 -6.373 8 7 6 5 4 3 2 1 编号 小结作业 1.随机误差是引起预报值与真实值之间的误差原因之一,其大小取决于随机误差的方差. 2.产生随机误差的原因是多方面的,如一个人的体重除了受身高的影响外,还受饮食习惯,运动量,家族遗传等因素的影响. 3.在回归模型中,残差变量是一个不能被观测的量,但可以估计预报变量观测值中所包含的残差变量,这种估计对于查找样本数据中的错误和模型的评价极为有效. 作业: P90练习:1,2,3. * 第三章 统计案例 第一课时 3.1 回归分析的基本思想及其初步应用 问题提出 1.两个随机变量之间具有线性相关关系是如何直观理解的? 两个变量的样本数据的散点图大致分布在一条直线附近. 2.什么叫回归直线?回归直线方程的一般形式是什么? 散点图的分布从整体上最接近的一条直线,其方程是: 3.函数关系是一种确定性关系,相关关系是一种非确定性关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.在必修3中,我们采用的方法是:画散点图→求回归直线方程→用回归直线方程进行预报.在理论上,这种研究方法是不全面、不深刻的,因此,对回归分析的理论和方法,我们还得作进一步的研究. 探究(一):回归直线方程 思考1:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线方程中参数 , 的计算公式分别是什么? 思考2:点 称为样本点中心,那么样本点中心与回归直线的位置关系是如何? 回归直线经过样本点中心 思考3:设回归直线方程为 , 记 则在什么背景下n个样本数据与回归直线整体上最接近? Q最小时 思考4:将Q的表达式作如下变形: 如何化简? .其中 思考5:将Q的表达式进一步变形为: 若将此式看成是关于b的二次函数,则当b为何值时,它的值为最小? 思考6:综上分析,Q取最小值的充要条件是什么? 探究(二):相关性检验 思考1:如果具有相关关系的两个随机变量呈正相关或负相关,其散点图各有什么特点? 正相关:散点图分布在从左下角到右上角的区域; 负相关:散点图分布在从左上角到右下角的区域. 思考2:对任意一组样本数据都存在回归直线吗?都能求得参数 , 的值吗? 不一定存在回归直线,但可求得参数 , 的值. 思考3:对于一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),有什么办法判断变量x,y具有线性相关关系? 根据散点图的分布情况进行判断. 思
文档评论(0)