第8章 SPSS的相关分析和线性回归分析.ppt

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1、SPSS中的本质线性模型 2、案例:教育支出分析 根据1988-2012年全国人均消费性支出和教育支出的数据,对居民家庭教育支出和消费性支出之间的关系进行研究。 主要步骤 1、分析→回归→曲线估计 2、选择被解释变量 3、选择解释变量 4、选择模型 练习3 完成上例 3、案例: 居民在外就餐费用分析和预测 根据1991-2012年居民在外就餐的数据,对居民未来在外就餐的趋势进行分析和预测。 主要步骤 首先绘制就餐费用的序列图 图形→旧对话框→线图 曲线估计 1、分析→回归→曲线估计 2、选择被解释变量 3、选择解释变量 4、选择模型 5、“保存”按钮:指定“保存变量”和“预测个案” 练习4 完成上例 回归方程 1. 描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程 2. 简单线性回归方程的形式如下 E( y ) = ?0+ ?1 x 方程的图示是一条直线,因此也称为直线回归方程 ?0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值 ?1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值 估计(经验)的回归方程 简单线性回归中估计的回归方程为 其中: 是估计的回归直线在 y 轴上的截距, 是直线的斜率,它表示对于一个给定的 x 的值,是 y 的估计值,也表示 x 每变动一个单位时, y 的平均变动值 用样本统计量 和 代替回归方程中的未知参数 和 ,就得到了估计的回归方程 总体回归参数 和 是未知的,必需利用样本数据去估计 参数 β0 和 β1 的最小二乘估计 最小二乘法——图例 x y (xn , yn) (x1 , y1) ? ? ? ? ? ? ? ? ? (x2 , y2) (xi , yi) } ei = yi-yi ^ 最小二乘法 使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即 用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小 和 的计算公式 ? 根据最小二乘法的要求,可得求解 和 的标准方程如下 估计方程的求法——实例 【例】根据例8.1中的数据,配合人均消费金额对人均国民收入的回归方程 根据 和 的求解公式得 人均消费金额对人均国民收入的回归方程为 y = 54.22286 + 0.52638 x ^ 回归方程的显著性检验 1、拟合优度的检验 2、线性关系的检验 3、回归系数的检验 离差平方和的分解 1. 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面 由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响 2. 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示 图示 x y y { } } ? 离差分解图 三个平方和的关系 2. 两端平方后求和有 从图上看有 SST = SSR + SSE 总变差平方和 (SST) { 回归平方和 (SSR) { 残差平方和 (SSE) { 三个平方和的意义 1. 总平方和(SST) 反映因变量的 n 个观察值与其均值的总离差 2. 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 3. 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和 图示 x y y { } } ? 离差分解图 拟合优度检验——判定系数 r2 1. 回归平方和占总离差平方和的比例 2. 反映回归直线的拟合程度 3. 取值范围在 [ 0 , 1 ] 之间 4. r2 ?1,说明回归方程拟合的越好;r2?0,说明回归方程拟合的越差 5. 判定系数等于相关系数的平方,即r2=(r)2 拟合优度检验——估计标准误差 Sy 1. 实际观察值与回归估计值离差平方和的均方根 2. 反映实际观察值在回归直线周围的分散状况 3. 从另一个角度说明了回归直线的拟合程度 4. 计算公式为 注:上例的计算结果为14.949678 线性关系的检验 1. 检验自变量和因变量之间的线性关系是否显著 2. 具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著 如果是显著的,两个变量之间存在线性关系 如果不显著,两个变量之间不存在线性关系 检验的步骤 1. 提出假设 H0:线性关系不显著

文档评论(0)

441113422 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档