- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章 第二节 一元线性回归分析
●一、什么是回归分析?
测定变量之间数量变化关系的数学方法,称为回归分析。只有一个因变量和一个自变量的线性回归模型,叫一元线性回归模型。由于总体回归函数实际上是未知的,一元线性回归模型称为“样本回归直线”。其近似的函数关系为:
其中:β1、β2是待定系数,也叫回归系数。ut又称随机干扰项,(或随机误差项)它是一个特殊的随机变量,反映未列入方程式的其他各种因素对y的影响,随机误差项ut是无法直接观测的。随机误差项ut的假定条件如下:
●二、标准假定(高斯假定):
(1)误差项的期望值为0,即:;
(2)误差项的方差为常数,即:;
(3)误差项之间无系列相关关系,其协方差为0,
即:;
(4)自变量是给定的变量,与随机误差项线性无关;
(5)随机误差项服从正态分布。
※关于非标准条件下的分析方法参照《计量经济学》。
●三、回归系数β1、β2的估计值
由于假定的第一条,故:。理论上令:
对β1、β2求偏导数,经整理得:
以相关分析中例题为例:
▲案例1:某地区对15户居民家庭人均可支配收入与某类商品消费支出的调查数据如下:(百元/月)
合计:ΣX=1516,ΣY=423,ΣXY=44632,
ΣX2=163654,ΣY2=12311 。代入公式:
回归方程为:
◎ 9.9872和0.1802的经济含义?
●四、回归方程的估计标准差Sy:
◎估计标准差S越小,说明实际观察值与所拟合的样本回归线的离散度越小,样本回归线的代表性越强。
●五、回归方程的拟合度
●拟合度:指回归直线与各样本观察点的接近程度。
●可决系数:用来说明回归直线的拟合度。
●可决系数的理论依据:对“总离差平方和”进行分解。
Y 实际点y ·() 残差;:理论值
总离差
=28.2
X
从上图看出,每一观察点的离差,都可以分解为:
将上式两边平方,并对所有点(n个)求和,经整理得:
总的离差平方和 = 回归平方和 + 残差平方和
SST = SSR + SSE
两边同除以SST得:
1= SSR/ SST+ SSE/ SST
SSR/ SST=1- SSE/ SST
r2叫做可决系数(判定系数)
※可决系数r2测度了回归直线对观测数据的拟合程度。
假定所有观测值都落在直线上,则“残差平方和”SSE=0,r2=1,表示完全拟合;r2越接近于1,表示“回归平方和” 占“总的离差平方和”的比例越大,可决系数越大,回归直线的拟合度越高。
可决系数的取值范围为:0≤r2≤1。
◎r2的另一算法:
可决系数 = 相关系数的平方
◎用可决系数说明回归直线的拟合度比相关系数更慎重些。
●六、回归系数的显著性检验
回归系数的显著性检验是检验自变量对因变量的影响是否显著的问题。在 中,假如总体回归系数β2= 0,则总体回归线是一条水平线,表明自变量对因变量没有影响。
※回归系数的显著性检验就是检验回归系数与0之间是否有显著差异。检验的步骤:
陈述假设:;
计算假设统计量t值:;
(3)确定显著水平α,(一般为:0.05或0.01)自由度为df= n-2,查找相应的临界值;
(4)计算相关统计量,做出统计判断。
以上题为例:S=1.834 ΣX=1516,
ΣX2=163654。
陈述假设:H0:β2= 0,H0:β2≠ 0。
df=15-2=13,α=0.05 (双尾)t=2.1604
10.037879大于2.1604,拒绝原假设,接受备择假设。收入对该类商品消费支出有显著影响。
●七、回归预测
根据自变量X的取值,估计因变量y取值的可能范围,这个可能范围称为预测区间,或置信区间(置信度为1-α)。
在小样本的条件下,一般使用t分布df=n-2。设自变量x的任意取值为x0,根据回归方程可知因变量yt的点估计值为:假定x0=280(百元),则:
上述问题的估计区间为:
若置信度1-α为95%,df=n-2=15-2=13,tα/2=2.1604
▲习题1:
已知12户居民家庭收入与储蓄的有关数据。
X:月收入(百元);Y:月储蓄(百元)。ΣX=254,
ΣY=92,ΣX2=5950,ΣY2=794,ΣXY=2164。
要求:(1)计算相关系数;(2)拟一条回归模型并解释经济含义;(3)计算可决系数;(4)计算回归估计标准差;(5)对回归系数进行显著性检验(显著水平5%);(6)若x0=40(百元),置信度为95%时,其置信区间是多少?
解:(1)
文档评论(0)