一元线性回归分析预测法与多元回归分析.docx

一元线性回归分析预测法与多元回归分析.docx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一元线性回归分析预测法 概念(思路) 根据预测变量(因变量)Y和影响因素(自变量)X的历史统计数据,建立一元线性回归方程,然后代入X的预测值,求出Y的预测值的方法。 基本公式:y=a+bx 其中:a、b为回归系数,是未知参数。 基本思路: 利用X,Y的历史统计数据,求出合理的回归系数:a、b,确定出回归方程 根据预计的自变量x的取值,求出因变量y的预测值。 一元线性回归方程的建立 使用散点图定性判断变量间是否存在线性关系 例:某地区民航运输总周转量和该地区社会总产值由密切相关关系。 年份 总周转量(亿吨公里)Y 社会总产值(百亿元)X 1 12.5 30 2 14.5 36 3 14.7 38 4 15.1 41 5 15.5 48 6 16.8 52 7 17.5 53 8 18.2 53.5 9 18.8 55 使用最小二乘法确定回归系数 使实际值与理论值误差平方和最小的参数取值。 对应于自变量xi,预测值(理论值)为b+m*xi,实际值yi, min∑(yi-b-mxi)2,求a、b的值。 使用微积分中求极值的方法,得: 由下列方程代表的直线的最小二乘拟合直线的参数公式: 其中 m 代表斜率 ,b 代表截距。 一元线性回归.xls 回归方程的显著性检验 判断X、Y之间是否确有线性关系,判定回归方程是否有意义。 有两类检验方法:相关系数检验法和方差分析法 相关系数检验法 构造统计量r 相关系数的取值范围为:[-1,1],|r|的大小反映了两个变量间线性关系的密切程度,利用它可以判断两个变量间的关系是否可以用直线方程表示。 r值 两变量之间的关系 r=1 完全正相关 1>r>0 正相关,越接近1,相关性越强。越接近0,相关性越弱 r=0 不线性相关 0>r>-1 负相关,越接近-1,相关性越强;越接近0,相关性越弱 r=-1 完全负相关 两个变量是否存在线性相关关系的定量判断规则: 对于给定的置信水平α,从相关系数临界值表中查出r临(n-2),把其与用样本计算出来的统计量r0比较: 若|r0|〉r临(n-2)成立,则认为X、Y之间存在线性关系,回归方程在α水平上显著。差异越大,线性关系越好。反之则认为不显著,回归方程无意义,变量间不存在线性关系。 其中:n为样本数。 方差分析法: 方差分析的基本特点是把因变量的总变动平方和分为两部分,一部分反映因变量的实际值与用回归方程计算出的理论值之差,一部分反映理论值与实际值的平均值之差。 Y的总变差=Y的残余变差+Y的说明变差,SST=SSE+SSR 或:总离差平方和=剩余平方和+回归平方和 回归平方和U与剩余平方和Q相比越大,说明回归效果越好。 注:在方差分析中,已被解释的和未被解释的变差除以相应的自由度的个数即变为方差。Y的方差是Y的总偏差平方和除以n-1,被解释的方差等于被解释的变差(因为回归只比估计Y的均值多用一个约束条件),残余方差等于残差偏差平方和除以n-2,残差的方差S2是误差方差的无偏且一致的估计(S叫做回归标准差)S2=Q/(n-m) 定量判断回归有效性有两种方法: 可决系数检验法 拟合优度统计量;判定系数 :r2=SSR/SST=U/Syy 调整的r2 =1-[Q/(n-m)]/[Syy/(n-1)] 复相关系数检验法:构造统计量R=SQRT[1-Q/Syy]=SQRT(U/Syy) 判断规则: 对于给定的置信度α,从相关系数r分布表中查出r临(n-m),把其与用样本计算出来的统计量R0比较: 若R0〉r临(n-m)成立,则认为回归方程在α水平上显著。反之则认为不显著,回归方程无意义,变量间不存在线性关系。 F检验法:构造统计量F=(U/m-1)/[Q/(n-m)] 其中:m为变量个数(总数);n为样本数。 统计量F服从第一自由度为m-1、第二自由度为n-m的 F(m-1,n-m)分布。 F=r2/(1-r2)*(n-m)/(m-1) 判断规则: 对于给定的置信度α,从F分布表中查出Fα(m-1,n-m),把其与用样本计算出来的统计量F0比较: 若F0〉Fα(m-1,n-m)成立,则认为回归方程在α水平上显著。反之则认为不显著,回归方程无意义,变量间不存在线性关系。 回归方程没有通过检验的原因 定性分析选择的各变量间,本来不存在因果关系。定性分析设想不准确。 选择的变量间存在因果关系,但还存在其它起着更重要作用的变量尚未列入模型之中。 选择变量之间的关系是非线性关系。 利用检验通过的回归方程进行预测 y=6.34+0.213x 点估计值:若给定x值,则y的预测值为6.34+0.213*58=18.69 区间估计: 标准误差:S=sqrt((∑e^2)/(n-m)) 一元非线性回归分析预测法 思路:与一元线性回归分析基本相同。即通过变量替换将非线性方程转化为

文档评论(0)

zxf886 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档