- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
31回归分析的基本思想及其应用初步B.doc
〖人教版高中数学选修2—3〗
第三章 统计案例
§2.1 回归分析的基本思想及其初步应用
第课时
教学过程
一.
【探索1】 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 现在的问题是:身高为172cm的女大学生体重为60.316kg分析:身高为172cm的女大学生的体重不一定为60.316kg,但一般可以认为她的体重在60.316kg左右,如图,由样本点和回归直线的位置关系说明这一点.
.
由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可以用线性回归模型
来表示,这里和为模型的未知参数,是与之间的误差.是随机变量,称为随机误差,它的均值,方差,这样
, ②
称为线性回归模型.的方差越小,用预报真实值的精确度就越高,故随机误差是引起预报值与真实值之间存在误差的原因之一;
⑵由于、是、的估计值,它们之间也存在误差,这种误差是预报值与真实值之间存在误差的另一原因.2.残差与残差图
的原因是什么?
分析:一个人的体重除了受身高的影响外,还受到其他许多因素的影响...是用预报真实值的随机误差,它是一个不可观察的量,那么应该怎样研究随机误差呢?
分析:在实际应用中,我们用回归方程
中的估计.,所以是的估计量.,,…,.
而言,它们的随机误差为
,.
其估计值为
,.
称为相应点的残差.
【思考2】 在实际问题中,如何发现数据中的错误?如何衡量模型的拟合效果呢?
分析:我们可以通过残差发现数据中的可疑数据,判断所建立模型的拟合效果.
下表列出了8名女大学生身高和体重数据 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 残差 -6.373 .627 2.419 -.618 1.137 6.627 -.883 0.382 我们可以通过图形来分析残差的特征,作图时纵坐标为残差,横坐标可以选用样本的编号,或身高数据,或体重估计值,这样作出的图形称为残差图,如图所示.
从图形可以看出,第1个样本点和第6个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误,如果数据采集有错误,就要予以纠正.
另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
3.
另外,我们还可以用
来刻画回归的效果.
对于已经获取的样本数据,R2表达式中的为确定的数.因此R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.
在上例中,通过计算,得出R2=0.64,表明“女大学的身高解释了64%的的体重变化” .
一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量.
(2)画出确定好的解析变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a).
(4)按一定规则估计回归方程中的参数(如最小二乘法).
(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等.
二.
【例1】 下列说法错误的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系 B.线性回归方程对应的直线 = x+至少经过其样本数据点(x1,y1),(x2,y2),…,(xn,yn)中的一个点 C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高 D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好 根据相关关系的概念知A正确根据线性回归直线不一定过样本数据点中的任意一个点,要通过样本中心点,故B不正确对于这组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好知C,正确 根据对R2为0.98的模型比R2为0.80的模型拟合的效果好,知D正确,故选B.弹簧长度y(cm)随所挂物体重量x(g)的不同而变化的情况如下表所示:
x 5 10 15 20 25 30 y 7.25 8.12 8.95 9.90 10.96 11.80 (1)画出散点图求y与x
您可能关注的文档
- 2014春第二学期考试方案.xls
- 2014研究方案1.doc
- 2014证券考试考点证券投资分析理论的发展与演变(下).doc
- 2014非计划再次手术分析.doc
- 2014高考化学专题解析13离子反应.doc
- 2014高考物理热点专题全方位突破受力分析共点力的平衡.pdf
- 201559高考物理中的选择题的分析和解题技巧.doc
- 2015二轮专题2受力分析平衡.doc
- 2015云南教师资格考试《小学教育教学知识与能力》押密预测材料分析练习题(五).doc
- 2015吉林省公务员面试技巧综合分析类题目作答技巧.doc
- 2023重庆科创职业学院招聘笔试真题及参考答案详解1套.docx
- 2023毕节医学高等专科学校招聘笔试真题及参考答案详解一套.docx
- 2023西安外事学院招聘笔试真题及参考答案详解一套.docx
- 2023河南对外经济贸易职业学院招聘笔试真题参考答案详解.docx
- 2023河南测绘职业学院招聘笔试真题带答案详解.docx
- 2023衡阳幼儿师范高等专科学校招聘笔试真题及答案详解一套.docx
- 2023河北司法警官职业学院招聘笔试真题附答案详解.docx
- 2023湖南汽车工程职业学院招聘笔试真题带答案详解.docx
- 2023湖南艺术职业学院招聘笔试真题附答案详解.docx
- 2023湖北幼儿师范高等专科学校招聘笔试真题及答案详解1套.docx
最近下载
- 2025年初级会计考试题库试题及答案(完整版).docx VIP
- 腰椎间盘突出症完整版.ppt VIP
- 第五单元互联网安全维护 第一节《互联网安全风险及其产生原因》 教学设计 2023—2024学年苏科版(2023)初中信息技术七年级下册.docx
- 施工现场灭火及应急疏散预案.doc VIP
- 过敏性鼻炎的合理用药参考答案-执业药师继续教育.docx VIP
- 孟铸的简历.市场营销总监.ppt VIP
- 2023年军考化学模拟试题.doc VIP
- 用好红色资源,传承好红色基因,把红色江山体会心得范文精选.docx VIP
- 医院药品采购管理制度及流程.docx VIP
- 新视野大学英语第三版第三册视听说原文.doc
文档评论(0)