2015-2016学年高中数学人教A版选修1-2课件:第1章 统计案例 1.1 回归分析的基本思想及其初步应用.ppt

2015-2016学年高中数学人教A版选修1-2课件:第1章 统计案例 1.1 回归分析的基本思想及其初步应用.ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
5月31日是世界无烟日.有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.这些疾病与吸烟有关的结论是怎样得出的呢?若从数学角度区分,这里的疾病和吸烟就是彼此相关的两个变量. 如何用数学的方法来刻画这种变量之间的关系呢?本章要学习的统计案例就是通过对一对变量使用线性回归的方法来研究变量之间的对应关系.通过本章的学习,我们将知道如何研究变量之间的相关关系,如何模拟变量之间的函数关系,如何检验两个变量之间的独立性. 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系. 通过求线性回归方程,探究相关性检验的基本思想. 通过对典型案例的探究,体会回归分析在生产实际和日常生活中的广泛应用. 重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法——相关指数和残差分析. 难点:解释残差变量的含义,回归直线系数的计算求解. 思维导航 1.下列图中的y与x相关吗? 新知导学 1.当一个变量取值改变时,另一个变量的取值随之改变,但带有__________,这样的两个变量之间的关系叫做相关关系. 思维导航 2.上图2中各点散布在一条直线附近,可否用这条直线对y随x的变化作出近似估计?如果可以,这条直线怎样求?如何刻画这种估计的可靠性? 新知导学 2.回归分析是处理两个变量之间__________常用的一种统计方法.若两个变量之间具有线性相关关系,则称相应的回归分析为______________. 4.线性相关关系强与弱的判断:用相关系数r来描述线性相关关系的强弱.当r>0时,表明两个变量__________;当r<0时,表明两个变量__________.r的绝对值越接近1,表明两个变量的线性相关性越_______;r的绝对值接近于0时,表明两个变量之间______________线性相关关系.通常当|r|大于______时,认为两个变量有很强的线性相关关系. 5.随机误差的概念:当样本点散布在某一条直线的附近,描述两个变量之间的关系是用线性回归模型____________来表示,其中________为模型的未知参数,______称为随机误差. 5.随机误差的概念:当样本点散布在某一条直线的附近,描述两个变量之间的关系是用线性回归模型____________来表示,其中__________为模型的未知参数,________称为随机误差. 6.回归效果的刻画 我们也可以用相关指数R2来刻画回归的效果,其计算公式是 R2=________________. 在线性回归模型中,R2表示解释变量对预报变量变化的__________. R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越________. 新知导学 7.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后,通过残差________________来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析. 8.利用图形来分析残差特性,作图时纵坐标为_____,横坐标可以选为________,这样作出的图形称为残差图.如果图中有某个样本点的残差比较大,需要确认在采集这个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.另外,残差点比较均匀地落在_______ _________中,说明选用的模型比较合适.这样的带状区域的宽度越____,说明模型拟合精度越高,回归方程的预报精度越高. 回归分析问题有线性回归问题和非线性回归问题,对于非线性回归问题,往往利用转换变量的方法转化为线性回归问题. [答案] C 2.在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是(  ) A.模型1的相关指数R2为0.98 B.模型2的相关指数R2为0.80 C.模型3的相关指数R2为0.50 D.模型4的相关指数R2为0.25 [答案] A [解析] 相关指数R2的取值范围为[0,1],其中R2=1,即残差平方和为0,此时预测值与观测值相等,y与x是函数关系,也就是说在相关关系中R2越接近于1,说明随机误差的效应越小,y与x相关程度越大,模型的拟合效果越好.R2=0,说明模型中x与y无关,故选A. 3.(2015·湖北文)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是(  ) A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关 [答案] C [解析

文档评论(0)

文档资料 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档