2016-2017学年高中数学 第三章 统计案例 3.1 第2课时 残差分析及回归模型的选择学案 新人教A版选修2-3.docVIP

2016-2017学年高中数学 第三章 统计案例 3.1 第2课时 残差分析及回归模型的选择学案 新人教A版选修2-3.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2016-2017学年高中数学 第三章 统计案例 3.1 第2课时 残差分析及回归模型的选择学案 新人教A版选修2-3

3.1 第二课时 残差分析及回归模型的选择 一、课前准备 1.课时目标 () 了解残差分析回归效果; 分析回归效果; (3) 了解常见的非线性回归转化为线性回归的方法. 2.基础预探 中,为模型的未知参数,与之间的误差,通常e为随机变量,称为_______.它的均值E(e)=0,方差. 线性回归模型的完整表达形式为.在此模型中,随机误差r的方差越小,通过回归直线预报真实值y的精度越高. 2.对于样本点而言,相应于它们的随机误差为,其估计值为,称为相应于点的______.类比样本方差估计总体方差的思想,可以用(n>2)作为的估计量,其中由公式给出,称为残差平方和.可以用衡量回归直线方程的预报精度.通常越小,预报精度越高. 3.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为_______. 4.用相关指数来刻画回归的效果,其计算公式是:.显然取值越大,意味着残差平方和_______,也就是说模型的拟合效果________. 二、学习引领 1. =bx+a;否则可选择指数模型、对数模型或二次函数模型等. (4)利用残差图或者相关指数对回归效果进行判断 2.随机误差e的产生及估计的方法 (1)在实际中,随机变量y除了受随机变量x的影响之外,还受其它变量的影响;(2)由于前面相关关系公式中的为截距和斜率的估计值,它们与真实值之间也存在误差.(3)因为随机误差是随机变量,因此可以通过这个随机变量的数字特征来刻画它的一些总体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机变量的均值为0,因此可以用方差来衡量随机误差的大小. 3.如何利用判断回归效果 在线性回归模型中,表示解释变量对于预报变量变化的贡献率. 越接近于1,表示回归的效果越好(因为越接近于1,表示解释变量和预报变量的相关性越强).如果对某组数据可能采取几种不同的回归方程进行回归分析.也可以通过比较几个,选择其值大的模型. 4.常见的可线性化的回归模型 (1)幂函数曲线y=axb(如图所示), 作变换u=lny ,v=lnx,c=lna,得线性函数u=c+bv. (2)指数函数y=aebx(如图所示) 作变换u=lny, c= lna,得线性函数u=c+bx. (3)倒指数曲线y=a(如图所示). (4)对数曲线y=a+blnx(如图所示) 三、典例导析=128.875 =8.95,进而求得 r=. 因为|r|接近1 ,所以可得交通事故数y和机动车辆数x有较强的线性相关关系. 规律总结:进行回归分析时, 通常先进行相关性检验, 若能确定两个变量具有线性相关关系, 再去求其线性回归方程, 否则所求的方程无意义.两个变量正(负)相关时, 它们就有相同(反)的变化趋势,即当由小变大时,相应的有由小(大)变大(小)的趋势. 变式训练:某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系?从这个工业部门内随机抽取了10个企业作样本,有如下资料.见下表. 产量x (千克) 40 42 48 55 65 79 88 100 120 140 生产费用y(千元) 150 140 160 170 150 162 185 165 190 185 完成下列要求: (1)计算x与y的相关系数; (2)对这两个变量之间是否线性相关进行相关性检验。 题型二 残差分析 某城区为研究城镇居民月家庭人均生活费支出和月人均收人的相关关系.随机抽取10户进行调查.其结果如下: 月人均收人 x(元) 300 390 420 520 570 700 760 800 850 1080 月人均生活费 y (元) 255 324 335 360 450 520 580 600 630 750 试预测人均月收人为1100元和人均月收入为1200元的两个家庭的月人均生活费. 思路导析:列表计算出相关系数所需数据,代入公式即可求出相关系数r,初步判断两个变量之间是否具备相关性,然后做出残差图判断选用的模型是否合适. 解析:作出散点分布图,由图可知月人均生活费与人均收人之间具有线性相关关系. 由题意可知:, 计算相关系数可得 r=0.99316, 因为|r|接近1 ,所以可得两个变量有较强的线性相关关系. 代入公式可知==0.6599 , =-=58.751. 故回归直线方程为=0.6599x+58.751. 作残差如图所示,由图可知,残差点比较均匀地分布在水平的带状区域中,说明选用的模型比较合适. 计算相关指数R2=0.986 3,说明城镇居民的月人均生活费的差异有98.63%是由人均收人引

您可能关注的文档

文档评论(0)

专注于电脑软件的下载与安装,各种疑难问题的解决,office办公软件的咨询,文档格式转换,音视频下载等等,欢迎各位咨询!

1亿VIP精品文档

相关文档