[计算机软件及应用]回归预测法.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[计算机软件及应用]回归预测法

(1)、 F检验及其步骤: 提出假设 H0:b=0 (线性关系不显著) 2. 计算检验统计量F 确定显著性水平?,并根据分子自由度1和分母自由度n-2找出临界值F ? 作出决策:若F?F ?,则回归方程显著;(拒绝H0); 若FF ?,则回归方程不显著(接受H0). 回归系数的显著性检验 (步骤) 提出假设 H0: b = 0 (没有线性关系) H1: b ? 0 (有线性关系) 计算检验的统计量 确定显著性水平?,查t分布表的tα/2(n-2), 并进行决策 ? t?t???,拒绝H0,即回归系数显著; ? t?t???,接受H0,即回归系数不显著。 ?4、进行预测 在预测时,有点预测和区间预测。 (1)、点预测 点预测就是利用自变量的已知值,由回归预测方程: 计算因变量的值作为预测值。 点预测是预测平均值 但是点预测,不容易分析预测的可靠性和准确性,因此可用区间预测。 (2)、区间预测 区间预测就是对于给定的一个自变量x的值,需给出一个在一定概率保证程度下的预测值落入的置信区间。近似的置信区间的常用公式为: 置信区间= 如果要使每一个特定的y值落在该置信区间内的概率为90%,则上式为: 置信区间= 其中 为t分布表(附表二) 中的数值, 小样本 更为精确的置信区间的计算公式为, 置信区间的上下限= 其中x0为用于预测y的x值。 人均收入和消费案例的程序 sol=lm(y~x) summary(sol) 可见常数项不显著,应从模型中删除 sol=lm(y~x+0) summary(sol) plot(x,y) lines(x,fitted(sol)) new=data.frame(x=c(680,730))#要预测估计的数据组成数据框 pred-predict(sol,new,interval=prediction,level=0.95) pred 5 、经济控制 问题:若要求Y落在一定范围内,问自变量X应控制在什么范围? 多元线性回归预测 1、多元线性回归的模型 Y=a+b1X1-+b2X2+…+bmXm 2、多元线性回归的参数估计 (最小二乘法) 3、多元线性回归的误差分析与统计检验 4、多元线性回归的预测 多元线性回归的参数估计 如果在对变量Y与Xi(i=1,2,…,m)的n次观察中,获得了如下数据: 用最小二乘法做参数估计 多元函数求极值 对上式中的a、bi(i=1,2,…,m)分别求偏导,并令其等于零,经整理后得: 回归方程的显著性检验 F检验(全检验) H0: b1=b2=…=bm=0 若H0成立,则Y与X无明显线性关系,整个模型无意义。 t检验(个体检验) Hj0: bj=0; j=0,1…m. 其中b0=a 若Hj0成立,则Y与Xj无明显关系,可将Xj排除出模型。 复可决系数R2在0~1之间,值越大,模型解释能力越强 可用方差膨胀因子VIFj=1/(1-Rj2)值来判断变量的共线性问题. VIF10表示有较严重的共线性,接近1表示无此问题。 置信区间 多元回归的近似置信区间的估计方法同简单回归相类似,其置信区间的公式为: 线性回归案例 根据经验,在人的身高相等的情况下,血压的收缩压Y与体重X1(千克)、年龄X2(岁数)有关.现收集了13个男子的数据,见表 .试建立Y关于X1,X2的线性回归方程. 估计出Y=b0+b1X1+b2X2 F检验: H0: b1=b2=0. T检验: H0: bj=0 j=0,1,2 求解程序 blood-data.frame( X1=c(76.0,91.5,85.5,82.5,79.0,80.5,74.5,79.0,85.0,76.5,82.0,95.0,92.5),X2=c(50,20,20,30,30,50,60,50,40,55,40,40,20),Y=c(120,141,124,126,117,125,123,125,132,123,132,155,147) ) #建立数据框 lm.sol-lm(Y~X1+X2,data=blood) #进行回归分析 summary(lm.sol) #汇总分析结果 Y=-62.96+2.136X1+0.4002X2. 预测:X=(80, 40)时,相应Y的概率为0. 95的预测区间. new-data.frame(X1=c(80,75),X2=c(40,38)) lm.pred-predict(lm.sol,new,interval=prediction,level=0.95) lm.pred 回归分析的汇总结果 Call: lm

文档评论(0)

ctuorn0371 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档