- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三节 线性回归的显著性检验及回归预测PPT
第三节 线性回归的显著性检验及回归预测
在回归分析中,要检验因变量Y与自变量
X之间到底有无真正的线性关系,可以通过
回归系数的显著性检验(t检验)或回归方程
的显著性检验(F检验)来判断.
1
一、回归系数的显著性检验
回归系数显著性检验的目的是通过检验回
归系数β的值与0是否有显著性差异,来判断Y
与X之间是否有显著的线性关系.若β=0,则总体
回归方程中不含X项(即Y不随X变动而变动),因
此,变量Y与X之间并不存在线性关系;若β≠0,说
明变量Y与X之间存在显著的线性关系.
① 提出原假设与备择假设:
3
② 构造检验统计量
③根据已知条件实际计算统计量t的值;
④ 比较②与③中的计算结果,得到结论.
给定显著性水平α,这是t分布的双侧检验,查表计算出临界值 ,得出拒绝域;
回归系数的检验 (例题分析)
对例题的回归系数进行显著性检验(=0.05)
提出假设
计算检验的统计量
7
给定显著性水平α,查表计算出临界值 ,得出拒绝域
③根据已知条件实际计算统计量F的值;
④ 比较②与③中的计算结果,得到结论.
8
方差分析——把总离差平方和及其自由度进行分解,利用F统计量检验两变量间线性相关显著性的方法称为方差分析.方差分析的结果归纳如下:
离差来源
平方和
自由度
F值
回 归
剩 余
1
n-2
总计
n-1
线性关系的检验(例题分析)
提出假设
计算检验统计量F
10
确定显著性水平=0.05,并根据分子自由度1和分母自由度14找出临界值F =4.60
作出决策:若F F , 拒绝H0,认为能源消耗量与工业总产值两变量间的线性相关关系是显著的.
离差来源
平方和
自由度
F值
回 归
剩 余
1
14
总计
15
三、利用回归方程进行估计和预测
点估计
对于自变量x的一个给定值x0,根据回归方程得到因变量 y 的一个估计值
2. 点估计值有
y 的平均值的点估计
y 的个别值的点估计
在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同
y 的平均值的点估计
利用估计的回归方程,对于自变量x 的一 个给定值x0,求出因变量y的平均值的一个估计值E(y0) ,就是平均值的点估计
在能源消耗量与工业总产值的例子中,假如我们要估计能源消耗量为78十万吨的平均工业总产值,那么将78十万吨代入估计的回归方程,就得到了工业总产值的点估计:
y 的个别值的点估计
利用估计的回归方程,对于自变量x的一个给定值x0,求出因变量y的一个个别值的估计值 ,就是个别值的点估计.
例如,如果我们只是想知道能源消耗量为80万吨的工业总产值是多少,则属于个别值的点估计 。根据估计的回归方程得
区间估计
区间估计
点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计
对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间
区间估计有两种类型
置信区间估计(confidence interval estimate)
预测区间估计(prediction interval estimate)
置信区间估计
利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的估计区间 ,这一估计区间称为置信区间(confidence interval)
E(y0) 在1-置信水平下的置信区间为
式中:se为回归估计标准差
置信区间估计(例题分析)
【例】求出工业总产值的点估计为100亿元时,工业总产值95%置信水平下的置信区间.
解:根据前面的计算结果,已知n=16,
se=2.457,t(16-2)=2.1448
置信区间为
当工业总产值的点估计为100亿元时,工业总产值的平均值在97.9167亿元到102.0833亿元之间 .
预测区间估计
利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间(prediction interval)
y0在1-置信水平下的预测区间为
置信区间、预测区间、回归方程
影响区间宽度的因素
置信水平 (1 - )
区间宽度随置信水平的增大而增大
数据的离散程度Se
区间宽度随离程度的增大而增大
3. 样本容量
区间宽度随样本容量的增大而减小
4. 用于预测的 x0与x的差异程度
区间宽度随x0与x 的差异程度的增大而增大
预测区间估计(例题分析)
【例】求出能源消耗量为73十万吨时,工业总产值 95% 置信水平下的置信区间
文档评论(0)