- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人教版高中数学(文科)选修线性回归 ppt1
线 性 回 归 对于两个变量之间的关系,我们以前学过.函数关系是一种确定性关系.例如正方形的面积S与边长x之间的关系S=x2就是一种确定性关系,即对于自变量边长的每一个确定的值,都有唯一确定的面积的值与之对应. 两个变量之间的关系还有另外一种情况.我们来看看一块农田的水稻产量与施肥量之间的关系.在这个问题里,水稻产量不仅受到施肥量的影响,还受到其他不少因素(诸如气候情况、浇水、除虫等)的影响.因此,当施肥量一定时,水稻产量在取值上带有一定的随机性.像这种自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系. 与函数关系不同,相关关系是一种非确定性关系.对具有相关关系的两个变量进行统计分析的方法叫做回归分析. 在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg). 对于图1-9(1)中的各个点,你发现有什么特点吗? 可以发现,图1-9(1)中的各个点,大致分布在一条直线的附近,如图1- 9( 2)所示. 像图1-9(2)中的直线,可以画出不止一条,那么,其中哪一条直线最能代表变量x与y之间的关系呢? 这个式子展开后,是一个关于a,b的二次多项式.利用配方法,可以导出使Q取得最小值的a,b的求值公式(详细推导过程请见本小节后的阅读材料). 这里,我们将所得到的方程叫做回归直线方程,相应的直线叫做回归直线,而对两个变量所进行的上述统计分析叫做线性回归分析.我们看到,求出了这种具有两个变量的回归直线后,就可以根据其部分观测值,获得对这两个变量之间整体关系的了解. 下面根据公式④,来求第35页例子中的回归直线方程. 借助科学计算器,可以完成下表中的有关计算. 于是 例1.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据: 于是可得 对于变量y与x的一组观测值来说,我们把 r叫做变量y与x之间的样本相关系数,(简称相关系数),用它来衡量它们之间的线性相关程度. 利用第37页表的结果,我们来计算前面水稻产量与施化肥量的相关系数 一般地,当|r|与1接近到什么程度才表明 y与 x之间具有线性相关关系呢?为明确这一点,通常采用对相关系数r进行显著性检验(简称相关性检验)的方法.其中待检验的统计假设是两个变量不具有线性相关关系,检验的步骤如下. 1.在附表3中查出与显著性水平0.05与自由度n-2(n为观测值组数)相应的相关系数临界值r0.05。 如果|r|≤r0.05,那么可以认为y与x之间的线性相关关系不显著,从而接受统计假设. 按照上述步骤,我们来检验一下第35页水稻产量与施化肥量之间是否存在线性相关关系. 这个结论表明,前面求得的关于这两个变量之间的回归直线方程是有意义的. 又如,在第38页产品月总成本与月产量关系的例子中,查得相应于显著性水平0.05和自由度12-2的r0.05为0.576,又算得r=0.998,由rr0.05,可知,y与x之间存在显著的线性相关关系. 通常,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认其具有线性相关关系后,再求其回归直线. 我们看到,由部分观测值得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性问题转化成确定性问题来进行研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预报、资料补充等方面有着广泛的应用. 例2.我们考虑两个表示变量x与y之间的关系的模型,ε为误差项.模型如下: 模型1:y=6+4x;模型2:y=6+4x+ε. (1)如果x=3,ε=1,求两个模型中的y值; (2)如果x=3,ε=0,求两个模型中的y值; (3)分别说明以上两个模型是确定性模型还是随机性模型. 解(1)模型1:y=6+4x=6+4×3=18; 模型2:y=6+4x+ε=6+4×3+1=19. (2)模型1:y=6+4x=6+4×3=18; 模型2;y=6+4x+ε=6+4×3+0=18. (3)模型1中相同的x值一定得到相同的y,所以是确定性模型;模型2中相同的x值,因ε的不同所得y不一定相同,所以是随机性模型. ∴ 回归直线方程为 =1.8166+0.1962x. 练 习 题 1.设有一个回归方程为 =2-1.5
文档评论(0)