- 1、本文档共87页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《0.spss线性回归分析
第十章 线性回归分析过程 第一节 回归分析概述 1.回归方程 回归分析是处理变量x与y之间统计关系的一种统计方法和技术。如果要由x预测y的值,就要利用x与y的观察值,即样本观测值(x1,y1),(x2,y2),…,(xn,yn)来建立一个公式,当给定x值后,就代入此公式中算出一个y值,这个值就称为y的预测值。 如何建立这个公式? 1.绘制散点图 2.建立线性函数:y= α +βx 2.建立实际问题回归模型的过程 一、根据研究的目的,设置指标变量 二、搜集整理统计数据 三、确定理论回归模型的数学形式 四、模型参数的估计 五、模型的检验与修改 六、回归模型的运用 第二步:建立回归方程 线性方程式y= α +βx中的参数α ,β还不知道,这就需要由样本数据来进行估计,估计出α ,β的值后,以估计值 分别代替线性方程式中的α ,β,得到方程 这个方程就称为回归方程。 这里因为因变量y与自变量x的关系呈线性关系,因此我们也称上述方程为线性回归方程, α是线性回归方程所画出的直线在y轴上的截距 ,β为直线的斜率,它们分别被称作回归常数与回归系数。 第二节 一元线性回归 一元线性回归是描述两个变量之间统计关系的最简单的回归模型。 例1 假定一保险公司希望确定居民住宅火灾造成的损失数额与该住户到最近的消防站的距离之间的相关关系,以便准确地确定出保险金额,表1列出了15起火灾事故的损失及火灾发生地与最近的消防站的距离。 一、根据研究的目的,设置指标变量 试验指标:火灾损失 试验因素:距离消防站的距离 因此建立两个变量: x——距离消防站的距离 y——火灾损失 二、获取相关数据三、确定理论回归模型的数学形式 1.判断x变量与y变量之间的关系是否为线性相关关系? 判断方法:1)散点图 2)相关系数法 2.如果是显著线性相关关系,可以选择一元回归方程做为理论回归模型。 2.一元线性回归模型的数学形式 参数的估计 应用Spss软件进行回归参数的估计 1、执行Analyze →Regression →Linear命令,打开对话框 (1)从源文件量清单中选择一个数值型变量移入 Dependent框中,选择一个变量作为自变量移入Independent 框中 (2)点击OK 多元线性回归模型 一、多元线性回归模型的一般形式 二、多元线性回归方程的解释 以p=2为例。在建立空调机销售量的预测模型时,用y来表示空调机的销售量,用x1表示空调机的价格,用x2表示消费者可用于支配的收入。则可以建立二元线性回归模型: 三、 回归参数的估计 回归参数可以应用普通最小二乘估计。 具体计算可以通过spss软件进行。 未标准化回归方程为: y=35316.885+6.696x1+0.097x2 标准化回归方程为: y=0.809x1+0.18x2 四、模型的检验与修改 4.1 相关系数的显著性检验 4.2 F检验 4.3 t检验 4.4 样本决定系数 4.5 残差分析 4.1相关系数的显著性检验 由于一元线性回归方程讨论的是变量x与y之间的线性关系,所以我们可以用变量x与y之间的相关系数来检验回归方程的显著性。 当 r = 0 时,说明变量之间不存在线性相关关系; 当 0 r 1时,说明变量之间存在一定程度的正相关关系; 当 -1 r 0时,说明变量之间存在一定程度的负相关关系; 当r =1 或 r = -1 时说明变量之间完全正相关或完全负相关。 设总体 X 和 Y 的相关系数为 r,则检验的原假设和对立假设为: 其中零假设表示:假设变量之间不存在线性相关关系。 检验时采用的统计量为: 4.2回归方程的显著性检验 检验因变量与所有自变量之间的线性关系是否显著,是否可以用线性模型来描述因变量和自变量之间的关系。也就是检验所有回归系数是否同时与零无显著差异。应用F检验法加以检验。 注:检验是否可以用回归方程方法进行模型估计,也就是回归方程是否有效? 回归方程的显著性检验——F检验 F检验是根据平方和分解式,直接从回归效果检验回归方程的显著性。 F检验 总平方和反映因变量y的波动程度或称不确定性,在建立了y对x的线性回归后,总平方和SST就分解成回归平方和SSR与残差平方和SSE这两个组成部分,其中SSR是由回归方程确定的,也就是由自变量x的波动引起的,SSE是不能用自变量解释的波动,是由x之外的未加控制的因素引起的。这样,总平方和SST中,能够由自变量解释的部分为SSR,不能由自变量解释的部分为SSE。这样,回归
文档评论(0)