第2讲 相关与回归分析_SPSS软件使用之二.pptVIP

第2讲 相关与回归分析_SPSS软件使用之二.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2讲 相关与回归分析_SPSS软件使用之二.ppt

回归模型的类型 线性回归 非线性回归 一元回归 线性回归 非线性回归 多元回归 回归模型 * ad 1. 一元线性回归 涉及一个自变量的回归 因变量 y 与自变量 x 之间为线性关系 被预测或被解释的变量称为因变量(dependent variable),用 y 表示 用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用 x 表示 因变量与自变量之间的关系用一元线性方程来表示 * ad 一元线性回归模型 描述因变量 y 如何依赖于自变量 x 和误差项? 的方程称为一元线性回归模型 一元线性回归模型可表示为 y = b0 + b1 x + e y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化而引起的 y 的变化 误差项 ? 是随机变量 反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响 是不能由 x 和 y 之间的线性关系所解释的变异性 ?0 和 ?1 称为模型的参数 * ad 一元线性回归模型的基本假定 误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的 x 值,y 的期望值为 E ( y ) =? 0+ ? 1 x 对于所有的 x 值,ε的方差σ2 都相同 误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N( 0 ,σ2 ) 独立性意味着对于一个特定的 x 值,它所对应的ε与其他 x 值所对应的ε不相关 对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关 * ad 一元线性回归方程 (regression equation) 描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程 一元线性回归方程的形式如下 E( y ) = ?0+ ?1 x 方程的图示是一条直线,称为回归直线 ?0是回归直线在 y 轴上的截距,是当 x = 0 时 y 的期望值 ?1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值 * ad 估计的回归方程 (estimated regression equation) 一元线性回归中估计的回归方程为 用样本统计量 和 代替回归方程中的未知参数 和 ,就得到了估计的回归方程 总体回归参数 和 是未知的,必需利用样本数据去估计 其中: 是估计的回归直线在 y 轴上的截距, 是直线的斜率,它表示对于一个给定的 x 的值, 是 y 的估计值,也表示 x 每变动一个单位时, y 的平均变动值 * ad 最小二乘估计 使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即 用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小 * ad 最小二乘估计图示 x y (xn , yn) (x1 , y1) ? ? ? ? ? ? ? ? ? (x2 , y2) (xi , yi) } ei = yi-yi ^ * ad 最小二乘法 ( 和 的计算公式) 根据最小二乘法的要求,可得求解 和 的公式如下 * ad 回归直线的拟合优度 我们通过最小二乘法用一组样本值求出的估计的回归方程能不能代表总体?回归直线与各观测值的拟合程度如何?对于后一个问题,我们是通过判定系数的大小来判定的。 * ad 离差平方和的分解 (三个平方和的关系) SST = SSR + SSE 总平方和 (SST) { 回归平方和 (SSR) 残差平方和 (SSE) { { * ad 离差平方和的分解 (三个平方和的意义) 总平方和(SST) 反映因变量的 所有n 个观测值与其均值的总离差 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和 * ad 判定系数R2 (coefficient of determination) 回归平方和占总离差平方和的比例 反映回归直线对观测值的拟合程度 取值范围在 [ 0 , 1 ] 之间 R2 ?1,说明回归方程拟合的越好;R2?0,说明回归方程拟合的越差 判定系数等于相关系数的平方,即R2=r 2 * ad 显著性检验 为了判断:根据一组样本值求出的估计回归方程是否可信?即是否代表总体也具有此种关系?需要进行显著性

文档评论(0)

liuxiaoyu99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档