第九章-直线回归与相关分析.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第九章直线回归与相关分析第一节回归和相关的概念对两个变量,一个变量用符号x表示,另一个变量用y表示,通过试验或调查获得两个变量的成对观测值,可表示为(x1,y1),(x2,y2),…,(xn,yn)。如果两个变量属于因果关系,一般用回归分析,表示原因的变量称为自变量,用x表示,表示结果的变量称为依变量,用y表示。可用x取值预测y取值范围。如果两个变量是平行关系,只能用相关分析进行研究两个变量之间相关程度和性质,不能用一个变量的变化去预测另一个变量的变化。回归和相关分析,需注意的问题(1)变量间是否存在相关以及在什么条件下会发生什么相关问题,都必须由学科本身决定。(2)研究两个变量之间的关系时,要求其余变量尽量保持在同一水平。(3)两个变量成对观测值≥5(4)回归预测必须限制自变量x的取值区间,超出这个区间,变量间的关系类型可能会发生改变。第二节直线回归一、直线回归方程的建立上式读作“y依x的直线回归方程”,其中x是自变量,是与x值相对应的依变量y的点估计值,a称为回归截距,b是回归直线的斜率,称为回归系数为了使公式1能最好地反应y和x两变量间的数量关系,根据最小二乘法得出:例1:有人研究了黏虫孵化历期平均温度(x,℃)与历期天数(y,d)之间关系,试验资料如下表,试配合直线回归方程。二、直线回归的数学模型y=a+βx+εa为总体回归截距,β为总体回归系数,ε为随机误差如果是样本资料:y=α+bx+eα、b、e分别估计总体a、β、ε三、直线回归的假设检验(一)直线回归的变异来源U=bSPQ=SSy-U由于直线回归只有1个自变量,所以回归平方和的自由度为1,回归平方和等于回归方差,离回归平方和的自由度为n-1-1=n-2,回归平方和除以相应自由度离回归方差,记为sy/x2。sy/x为离回归标准差,习惯上称作回归估计标准误。(二)F检验H0:两变量间无线性关系;HA:有线性关系。试检验例1直线回归关系的显著性U=bSP=-2.5317×(-139.6937)=353.6628Q=SSy-U=377.2688-353.6628=23.6060(三)t检验H0:β=0;HA:β≠0。该方法是检验样本回归系数b是否来自β=0的双变量总体,以推断线性回归的显著性。回归系数的标准误sb和t值为:用t检验法检验例1回归关系的显著性F检验的结果与t检验的结果一致。事实上,统计学已证明,在直线回归分析中,这二种检验方法是等价的,可任选一种进行检验。四、直线回归的区间估计(一)总体回归截距a的置信区间回归截距a的标准误sa和t值为:L1=α-tasaL2=α+tasadf=n-2计算例1资料回归截距的95%和99%置信区间(二)总体回归系数β的置信区间L1=α-tasbL2=α+tasbdf=n-2计算例1回归系数的95%和99%置信区间(三)总体平均数μx/y置信区间对于给定的x,预测总体的平均数μx/y时:称为回归估计标准误根据例1,估计出黏虫孵化历期平均温度为15℃时,历期天数为多少(取95%置信区间)。(四)单个y值的置信区间单个y观测值的标准误为:根据例1,若某年的历期平均温度为15℃,该年的历期天数为多少(95%置信概率)第三节直线相关一、相关系数和决定系数如果两个变量间呈线性关系,又不需要由x来估计y,只需了x和y相关以及相关的性质,可通过计算x和y相关程度和性质的统计数-相关系数来进行研究。相关系数r为:决定为r2。Excel计算相关系数为:“数据分析”中的相关系数r与b符号取决于SP,二者符号相同。r的绝对值越接近于1相关程度越高;越接近于0,越无相关性。R为正表示正相关,为负表示负相关。求例1的相关系数和决定系数以上结果表明,x与y呈负相关,决定系数表明x与y的变异有93.74%可用二者之间的线性关系来解释。二、相关系数的假设检验为了判断r所代表的总体是否存在直线相关,必须测定r来自ρ=0总体的概率。试检验例1相关系数的显著性回归系数的假设检验与相关系数检验的结果是一致的,因此只需计算一个即可。Excel计算方法1、用散点图法,计算直线方程及决定系数2、使用数据分析进行回归,计算直线方程、决定系数,方差分析、置信区间等参数。第三节可直线化的非线性回归分析下面是几种常用的能直线化的曲线函数类型及其图型,并将其直线化,供进行曲线回归分析时选用。一、双曲线函数1/y=a+b/x令y′=1/y,x′=1/x,则可将双曲线函数直线化为:y′=a+bx′。三、指数函数(a0)

文档评论(0)

优美的文学 + 关注
实名认证
内容提供者

优美的文学优美的文学优美的文学优美的文学优美的文学

1亿VIP精品文档

相关文档