网站大量收购独家精品文档,联系QQ:2885784924

61第六章回归分析.pptVIP

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 回归分析 变量之间的联系 确定型的关系:指某一个或某几个现象的变动必然会引起另一个现象确定的变动,他们之间的关系可以使用数学函数式确切地表达出来,即y=f(x)。当知道x的数值时,就可以计算出确切的y值来。如圆的周长与半径的关系:周长=2πr。 非确定关系:例如,在发育阶段,随年龄的增长,人的身高会增加。但不能根据年龄找到确定的身高,即不能得出11岁儿童身高一定就是1米40公分。年龄与身高的关系不能用一般的函数关系来表达。研究变量之间既存在又不确定的相互关系及其密切程度的分析称为相关分析。 回归分析 如果把其中的一些因素作为自变量,而另一些随自变量的变化而变化的变量作为因变量,研究他们之间的非确定因果关系,这种分析就称为回归分析。 回归分析是研究一个自变量或多个自变量与一个因变量之间是否存在某种线性关系或非线性关系的一种统计学方法。 回归分析 线性回归分析; 曲线回归分析; 二维Logistic回归分析; 多维Logistic回归分析; 概率单位回归分析; 非线性回归分析; 权重估计分析; 二阶段最小二乘分析; 最优编码回归。 一、线性回归 (一)一元线性回归方程 直线回归分析的任务就是根据若干个观测(xi,yi)i=1~n找出描述两个变量x、y之间关系的直线回归方程y=a+bx。y是变量y的估计值。求直线回归方程y=a+bx,实际上是用回归直线拟合散点图中的各观测点。常用的方法是最小二乘法。也就是使该直线与各点的纵向垂直距离最小。即使实测值y与回归直线y之差的平方和Σ(y-y)2达到最小。Σ(y-y)2也称为剩余(残差)平方和。因此求回归方程y=a+bx的问题,归根到底就是求Σ(y-y)2取得最小值时a和b的问题。a称为截距,b为回归直线的斜率,也称回归系数。 1、一元线性回归方程的适用条件 线性趋势:自变量与因变量的关系是线形的,如果不是,则不能采用线性回归来分析。 独立性:可表述为因变量y的取值相互独立,它们之间没有联系。反映到模型中,实际上就是要求残差间相互独立,不存在自相关。 正态性:自变量x的任何一个线形组合,因变量y均服从正态分布,反映到模型中,实际上就是要求随机误差项εi服从正态分布。 方差齐性:自变量的任何一个线形组合,因变量y的方差均齐性,实质就是要求残差的方差齐。 2、一元线性回归方程的检验 检验的假设是总体回归系数为0。另外要检验回归方程对因变量的预测效果如何。 (1)回归系数的显著性检验 对斜率的检验,假设是:总体回归系数为0。检验该假设的t值计算公式是;t=b/SEb,其中SEb是回归系数的标准误。 对截距的检验,假设是:总体回归方程截距a=0。检验该假设的t值计算公式是: t=a/SEa,其中SEa是截距的标准误。 (2) R2判定系数 在判定一个线性回归直线的拟合度的好坏时,R2系数是一个重要的判定指标。 R2判定系数等于回归平方和在总平方和中所占的比率,即R2体现了回归模型所能解释的因变量变异性的百分比。如果R2=0.775,则说明变量y的变异中有77.5%是由变量X引起的。当R2=1时,表示所有的观测点全部落在回归直线上。当R2=0时,表示自变量与因变量无线性关系。 为了尽可能准确的反应模型的拟合度,SPSS输出中的Adjusted R Square是消除了自变量个数影响的R2的修正值。 (3)方差分析 体现因变量观测值与均值之间的差异的偏差平方和SSt是由两个部分组成: SSt=SSr+SSe SSr:回归平方和,反应了自变量X的重要程度; SSe :残差平方和,它反应了实验误差以及其他意外因素对实验结果的影响。这两部分除以各自的自由度,得到它们的均方。 统计量F=回归均方/残差均方。当 F值很大时,拒绝接受b=0的假设。 (4)Durbin-Watson检验 在对回归模型的诊断中,有一个非常重要的回归模型假设需要诊断,那就是回归模型中的误差项的独立性。如果误差项不独立,那么对回归模型的任何估计与假设所作出的结论都是不可靠的。其参数称为DW或D。D的取值范围是0<D<4,统计学意义如下: ①当残差与自变量互为独立时D≈2; ③当相邻两点的残差为正相关时,D2; ③当相邻两点的残差为负相关时,D2 (5)残差图示法 在直角坐标系中,以预测值y为横轴,以y与y之间的误差et为纵轴(或学生化残差与拟和值或一个自变量),绘制残差的散点图。如果散点呈现出明显的规律性则,认为存在自相关性或者非线性或者非常数方差的问题。 (二)多元线性回归 1.多元线性回归的概念 多元线性回归:根据多个自变量的最优组合建立回归方程来预测因变量的回归分析称为多元回归分析。多元回归分析的模型为:y=b0+b1x1+b2x2+ …+bnxn 其中y为根据所有

文档评论(0)

peace0308 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档