第五章回分析预测法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章回分析预测法

PAGE PAGE 13一元线性回归分析预测法概念(思路)根据预测变量(因变量)Y和影响因素(自变量)X的历史统计数据,建立一元线性回归方程,然后代入X的预测值,求出Y的预测值的方法。基本公式:y=a+bx其中:a、b为回归系数,是未知参数。基本思路:利用X,Y的历史统计数据,求出合理的回归系数:a、b,确定出回归方程根据预计的自变量x的取值,求出因变量y的预测值。一元线性回归方程的建立使用散点图定性判断变量间是否存在线性关系例:某地区民航运输总周转量和该地区社会总产值由密切相关关系。年份总周转量(亿吨公里)Y社会总产值(百亿元)X112.530214.536314.738415.141515.548616.852717.553818.253.5918.855使用最小二乘法确定回归系数使实际值与理论值误差平方和最小的参数取值。对应于自变量xi,预测值(理论值)为b+m*xi,实际值yi,min∑(yi-b-mxi)2,求a、b的值。使用微积分中求极值的方法,得:由下列方程代表的直线的最小二乘拟合直线的参数公式:其中 m 代表斜率 ,b 代表截距。 HYPERLINK 书上一元线性回归.xls 一元线性回归.xls回归方程的显著性检验判断X、Y之间是否确有线性关系,判定回归方程是否有意义。有两类检验方法:相关系数检验法和方差分析法相关系数检验法构造统计量r相关系数的取值范围为:[-1,1],|r|的大小反映了两个变量间线性关系的密切程度,利用它可以判断两个变量间的关系是否可以用直线方程表示。r值两变量之间的关系r=1完全正相关1r0正相关,越接近1,相关性越强。越接近0,相关性越弱r=0不线性相关0r-1负相关,越接近-1,相关性越强;越接近0,相关性越弱r=-1完全负相关两个变量是否存在线性相关关系的定量判断规则: 对于给定的置信水平α,从相关系数临界值表中查出r临(n-2),把其与用样本计算出来的统计量r0比较:若|r0|〉r临(n-2)成立,则认为X、Y之间存在线性关系,回归方程在α水平上显著。差异越大,线性关系越好。反之则认为不显著,回归方程无意义,变量间不存在线性关系。其中:n为样本数。方差分析法:方差分析的基本特点是把因变量的总变动平方和分为两部分,一部分反映因变量的实际值与用回归方程计算出的理论值之差,一部分反映理论值与实际值的平均值之差。Y的总变差=Y的残余变差+Y的说明变差,SST=SSE+SSR或:总离差平方和=剩余平方和+回归平方和回归平方和U与剩余平方和Q相比越大,说明回归效果越好。注:在方差分析中,已被解释的和未被解释的变差除以相应的自由度的个数即变为方差。Y的方差是Y的总偏差平方和除以n-1,被解释的方差等于被解释的变差(因为回归只比估计Y的均值多用一个约束条件),残余方差等于残差偏差平方和除以n-2,残差的方差S2是误差方差的无偏且一致的估计(S叫做回归标准差)S2=Q/(n-m)定量判断回归有效性有两种方法:可决系数检验法拟合优度统计量;判定系数 :r2=SSR/SST=U/Syy 调整的r2 =1-[Q/(n-m)]/[Syy/(n-1)]复相关系数检验法:构造统计量R=SQRT[1-Q/Syy]=SQRT(U/Syy)判断规则:对于给定的置信度α,从相关系数r分布表中查出r临(n-m),把其与用样本计算出来的统计量R0比较:若R0〉r临(n-m)成立,则认为回归方程在α水平上显著。反之则认为不显著,回归方程无意义,变量间不存在线性关系。F检验法:构造统计量F=(U/m-1)/[Q/(n-m)]其中:m为变量个数(总数);n为样本数。统计量F服从第一自由度为m-1、第二自由度为n-m的F(m-1,n-m)分布。F=r2/(1-r2)*(n-m)/(m-1)判断规则:对于给定的置信度α,从F分布表中查出Fα(m-1,n-m),把其与用样本计算出来的统计量F0比较:若F0〉Fα(m-1,n-m)成立,则认为回归方程在α水平上显著。反之则认为不显著,回归方程无意义,变量间不存在线性关系。回归方程没有通过检验的原因定性分析选择的各变量间,本来不存在因果关系。定性分析设想不准确。选择的变量间存在因果关系,但还存在其它起着更重要作用的变量尚未列入模型之中。选择变量之间的关系是非线性关系。利用检验通过的回归方程进行预测y=6.34+0.213x点估计值:若给定x值,则y的预测值为6.34+0.213*58=18.69区间估计:标准误差:S=sqrt((∑e^2)/(n-m))一元非线性回归分析预测法思路:与一元线性回归分析基本相同。即通过变量替换将非线性方程转化为线性方程;使用最小二乘法建立线性回归方程;在通过逆变换将线性方程转化为非线性方程。函数的线性变换及逆变换是个数学问题,不讲了。例

文档评论(0)

linjuanrong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档