- 20
- 0
- 约2.2千字
- 约 59页
- 2021-03-23 发布于湖南
- 举报
第七章 相关回归分析;问题的提出;实例二:世界卫生组织2016年发布的研究结果显示,肥胖正在全球流行,每年至少有280万人的死亡可归咎于超重或肥胖。肥胖曾被视为高收入国家的问题,而现在低收入和中等收入国家也广泛存在这一问题。其中,儿童肥胖是21世纪面临的最严峻的公共卫生挑战之一。
相对于非超重儿童而言,他们可能会较早罹患糖尿病和心血管疾病,从而加剧过早死亡和残疾的风险。那么儿童肥胖与哪些因素有关?
一项针对某市7~9岁儿童的调查显示,在被调查的2533名二、三年级小学生中,超重率为34.14%,肥胖率为18%。经过多因素回归分析发现,儿童生活方式、饮食习惯、运动情况及父母超重肥胖情况与儿童肥胖密切相关。食欲好、进食速度快、不喜欢体育运动、看电视时间长、睡眠时间短以及父母超重肥胖可能成为儿童肥胖的危险因素。;第一节 相关分析基本问题
;一、相关关系与函数关系;(二)相关关系
指的是现象之间存在的非确定性的数量依存关系,即现象之间虽然存在着数量依存关系,一个现象发生数量上的变化时,另一个现象数量水平也会相应地发现变化,但这种数量关系并不是严格一一对应。
;相关关系和函数关系既有区别,又有联系。;二、相关关系的类型;x;三、相关分析的基本步骤;第二节 相关关系的测定
;一、相关关系的一般判断;年份;某省城镇居民家庭人均可支配收入和人均消费性支出相关图(计量单位:元);二、相关系数的测定;;
计算结果表明该省城镇居民家庭人均可支配收入和人均消费性支出之间为正相关关系,且高度相关;当r=0时,表示两变量间无线性相关关系。
0|r| 0.3,表示两变量间存在微弱相关;
0.3 ≤|r|0.5,表示两变量间存在低相关(弱相关);
0.5 ≤|r|0.8,表示两变量间存在显著相关(中相关);
;;【例7.2】表7.3是10名学生的数学成绩和物理成绩及有关计算数据,要求判断学生这两门课程成绩之间的相关性。
;;1. 相关系数不能解释两变量间的因果关系
2. 警惕虚假相关导致的错误结论
3. 注意不要在相关关系据以成立的数据范围以外,推论这种相关关系仍然保持;第三节 回归分析
;一、回归分析???概述;2021-03-22;(二)回归分析和相关分析的联系和区别;;(三)回归分析的主要内容;2021-03-22;二、简单线性回归分析;(二)简单线性回归模型的参数估计;用直线方程;;【例7.3】例如,某省1996-2015年生产总值与能源消费量数据如表7.4所示(已消除物价影响后的可比数据),要求建立以全省能源消费量为因变量的回归方程。;年份;;回归直线示意图;2021-03-22;前面论证的OLS法已经使我们所估计的样本回归函数具有最小离差,为什么还要讨论拟合优度的问题。
这是因为OLS估计式具有最小方差性和无偏性,只是反映了这样一个事实,即相对于一切样本回归函数来说,由OLS估计式所确定的样本回归函数具有某些特性,但它并不能说明单个样本回归函数具有较高的拟合程度。
;2021-03-22;2021-03-22;2021-03-22;3. 模型整体拟合效果的显著性检验——F检验
根据 ,由方差分析原理可知,当随机误差项服从正态分布时,应该有:
SSR~ ,SSE~ ,
所以,有 F 统计量:
当回归方程拟合效果越好,表明方程解释部分所占比重越大,SSR与SSE相比的值也越大,F 统计量也越大。
;因此,方程整体显著性检验的假设为:
(回归方程整体是不显著的)
(回归方程整体是显著的) 在给定显著性水平 之下,若:
,则拒绝原假设,认为回归方程整体是显著的。
;4. 模型参数显著性的检验——t检验
模型参数显著性检验主要是判断每一个自变量对于回归模型是否必要。在一元线性回归模型中,主要是检验模型系数理论值 和 是否显著地等于零。
如果模型的误差项是符合建模假设的,则有:
;因此,截距项 的t检验为:
在原假设成立时,t 统计量为:
在给定的显著性水平之下,若该t统计量值大于 ,则拒绝原假设,认为截距项是显著的。否则,应该考虑拟合无截距项的直线回归模型。
;同样地,回归系数 的 t 检验为:
在原假设成立时,t 统计量为:
若该t统计量值大于 ,则拒绝原假设,认为回归系数对方程的影响是显著的,或自变量是重要的。否则,说明该参数显著为零,该自变量对模型的影响是不重要的,应该考
原创力文档

文档评论(0)