- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生统:第六章一元回归及简单相关分析
第六章 一元回归及简单相关分析; 1、按两变量相关的程度分类
(1)完全相关:一变量的值定后,另一变量的值可通过某公式求出来,即一个变量的值可由另一个变量所完全决定。
(2)不相关:变量之间完全没有任何关系。一个变量的值不能提供另一个变量的任何信息。
(3)统计相关(不完全相关) :介于上述两种情况之间。已知一个变量的值,通过某公式可提供另一个变量一些信息,如均值等。(本章讨论); 2、按两变量的地位分类
(1)相关关系:两变量X,Y均为随机变量,任一变量的每一个可能值另一个变量都有一个确定的分布与之对应。如:人的身高和体重之间的相关关系。
(2)回归关系:X为一般变量,Y是随机变量,每一确定X值,Y有一个确定分布与之对应。如施肥量与产量之间存在着回归关系。
相关关系中的两个变量地位是对称的,可以认为它们互为因果;而回归关系中X是自变量,Y是因变量,即把X视为原因,把Y视为结果。 ; 回归和相关分析目的不同:
相关分析:重点研究X与Y两个随机变量之间的共同变化规律,如当X增大时Y如何变化,以及这种共变关系的强弱。
回归分析:建立X与Y间数学关系式,用于预测。即X取一新值,预测在此情况下的Y的取值。
相关分析只能研究两个变量之间相关程度和性质,不能用一个变量的变化去预测另一个变量的变化,这是回归与相关区别的关键所在。; 进行回归和相关分析时注意:
(1)一个变量的变化通常受许多其他变量的影响,研究两变量间关系时,其它变量保持在同一水平。回归和相关分析可能会导致不可靠甚至虚假的结果。如人的身高和胸围之间的关系,体重固定,身高越高的人,胸围一定较小,当体重在变化时,其结果就会相反。
;(2)两个变量成对观测值尽可能多(≥5对),提高分析的准确性;变量X的取值范围尽可能大一些,易发现两个变量间的相互关系。
(3)回归与相关分析一般是在变量一定取值区间内对两个变量间的关系进行描述,超出区间变量间的关系类型可能发生改变。回归预测必须限制自变量X的取值区间,外推要谨慎。
; 图a和b两变量间关系是直线型,图c曲线型。图a的两个变量关系较图b密切,且正向,图b负向。
散点图表示两个变量间关系的定性研究。; P177-179
表10-1、图10-1单位叶面积干物质和NaCl含量之间呈直线关系,点不完全在一直线上。
表10-2、图10-2增加每一NaCl含量下的观测次数,取平均数做散点图基本为一直线。
实际中,不能进行多次的重复,在有限点上,用回归方法将其理论关系推导出来。; 二、一元线性回归方程
; 图10-2表示以每一NaCl含量下( )的10次观测次数的平均值(条件平均数 )做图,NaCl含量和单位叶面积干物质量成直线关系:
直线含义:变量X的每一个值,都有一个Y的分布,这个分布的平均数是线性函数。
; 回归分析需满足以下假定:; 三、参数?和β的估计
求?和β的估计值a与b ,得一估计直线:
称Y依X的直线回归方程,a为回归截距,b为回归系数,X是自变量, 为与X相对应的因变量Y的总体平均数 的估计值。
最小二乘法求出a和b。
;平均数特性:
离均差的平方和
最小。同理把观
测值与回归估计
值之间的离差平
方和
达到最小时的回
归线,是所有直线
中最接近散点图中
全部散点的直线。
求出L达最小时的a与b值,此法称最小二乘法。
;;整理得方程组:
解方程组得:;四、一元线性回归方程的计算;图10-4为该例的散点图和回归线。;例:下表为某品系小麦的穗长与穗重的数据,根据表中数据求回归方程,并预测穗长40厘米的麦穗重。;解:设穗长为X,穗重为Y。计算得:
;第三节 一元线性回归的检验; 若总体不存在线性回归,则总体回归系数等于零。
该方法是检验样本回归系数b是否来自 的双变量总体,以推断线性回归的显著性。
统计量:
;例10.2,检验例10.1数据。
解:
结论:叶片干物质在NaCl含量上的回归极显著。;。; 二、一元回归的方差分析(无重复)
方差分析原理,Y的平方和分解为X变异引起的平方和误差因素引起的平方和。
图中每观测点距平均数的离差:
;以表10-1数据做回归显著的方差分析
; 回归分析意义重要一点是预测预报,即由一个变量去预测另一个变量的变化。利用回归方程:
注意:回归预测必须限制在X的取值范围。;第四节 相关(P207); 2、相关系数性质;
; 3、相关系数的计算
1例:从男青年总体中随机抽取11名男
文档评论(0)