数学人教A版选修2-3教材梳理:3.1回归分析的基本思想及其初步应用Word版含解析.docVIP

数学人教A版选修2-3教材梳理:3.1回归分析的基本思想及其初步应用Word版含解析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学人教A版选修2-3教材梳理:3.1回归分析的基本思想及其初步应用Word版含解析

庖丁巧解牛 知识·巧学 一、回归直线方程 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的截距和斜率的最小二乘估计公式分别为:=, =. 回归直线方程中的=称为样本点的中心.回归直线过样本点的中心. 二、相关系数及相关检验 给定(xi,yi)(i=1,2,…,n),只要x1,x2,…,xn不全相等,就能求出一条回归直线,因此它有无意义就是个大问题.由于根据散点图看数据是否大致在一直线附近主观性太强,可利用下面量化的检验法. 当xi不全相等,yi也不全相等时,r=. 叫做变量y与x之间的样本相关系数(简称相关数),|r|≤1. 当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近0时,表明两个变量之间几乎不存在线性相关关系. 通常,当r的绝对值大于0.75时认为两个变量有很强的线性相关关系. 联想发散 注意此处空半格当|r|与1接近到什么程度才表明Y与x之间具有线性相关关系呢?为明确这一点,常通过相关性检验的方法,其步骤如下: (1)作统计假设:x与Y不具有线性相关关系; (2)根据小概率0.05与n-2在附表中查出r的一个临界值r0.05; (3)根据样本相关系数计算公式算出r的值; (4)作统计推断,如果|r|>r0.05,表明有95%的把握认为x与y之间具有线性相关关系.如果|r|≤r0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的. 三、回归分析 1.随机误差 在线性回归模型y=bx+a+e中,a和b为模型的未知参数,e是y与=bx+a之间的误差,通常e为随机变量,称为随机误差.它的均值E(e)=0,方差D(e)=σ20. 线性回归模型的完整表达形式为在此模型中,随机误差r的方差σ2越小,通过回归直线=bx+a预报真实值y的精度越高. 深化升华 注意此处空半格引起随机误差e的原因:(1)在实际中,随机变量y除了受随机变量x的影响之外,还受其他变量的影响;(2)由于前面相关关系公式中的和为截距和斜率的估计值,它们与真实值a和b之间也存在误差. 2.方差分析 对于样本点(x1,y1),(x2,y2),…(xn,yn)而言,相应于它们的随机误差为 ei=yi-=yi-bxi-a(i=1,2,…,n),其估计值为=yi-=yi-xi-(i=1,2,…,n),称为相应于点(xi,yi)的残差.类比样本方差估计总体方差的思想,可以用2=Q(,)(n>2)作为的估计量,其中和由公式给出,Q(,)称为残差平方和.可以用衡量回归直线方程的预报精度.通常越小,预报精度越高. 要点提示 注意此处空半格因为随机误差是随机变量,因此可以通过这个随机变量的数字特征来刻画它的一些总体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机变量的均值为0,因此可以用方差σ2来衡量随机误差的大小. 3.残差分析 在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差,来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析.其中残差是数据点yi和它在回归线上相应位置之间的差异,即=yi-. 4.相关指数R2 用相关指数R2来刻画回归的效果,其计算公式是:R2= 显然R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好. 深化升华 注意此处空半格在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率.R2越接近于1,表示回归的效果越好(因为R2越接近于1,表示解释变量和预报变量的相关性越强).如果对某组数据可能采取几种不同的回归方程进行回归分析.也可以通过比较几个R2,选择其值大的模型. 四、建立回归模型的基本步骤 (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等); (3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a); (4)按一定规则估计回归方程中的参数(如最小二乘法); (5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等. 问题·探究 问题1两个变量具有线性相关关系和两个变量具有函数关系相同吗?你对二者关系是如何理解的? 思路:相关关系与函数关系不同,因为函数关系是一种确定性的关系,而相关关系是一种非确定性关系.相关

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档