spss讲稿6题材.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、回归分析概述 一 回归分析理解 1 “回归”的含义 英国统计学家F. galton研究研究父亲身高和儿子身高的关系时的独特发现,在两者散点图中发现一条贯穿其中的直线,它能够很好地描述父亲和儿子身高间的关系。研究发现:若父亲身高很高,则儿子也会较高,但不会像父亲那样高;若父亲很矮,则儿子也会较矮,但不会像父亲那么矮。成年儿子的身高趋向于子辈身高平均值。 F. galton将这种现象称为“回归”;将那条贯穿于数据点中的线称为“回归线”。后人们将研究事物间统计关系的数量分析方法称为回归分析。由此可知,回归分析的核心目的是找到回归线,涉及到如何得到回归线、如何描述回归线、回归线是否可用于预测等。 2 回归线的获得方式一:局部平均 (足够大的样本量) 回归曲线上的点给出了相应于每一个x 父亲 值的y 儿子 平均数的估计 3 回归线的获得方式二:拟和函数 使数据拟和于某条曲线; 通过若干参数描述该曲线; 利用已知数据在一定的统计准则下找出参数的估计值 得到回归曲线的近似 ; 一、回归分析概述 二 回归分析的基本步骤 1 确定自变量和因变量: 父亲身高关于儿子身高的回归与儿子身高关于父亲身高的回归是不同的 . 2 确定回归模型:依函数拟合方式,通过观察散点图确立应通过哪种数学模型来概括回归线。选择线性回归还是非线性回归模型。 3 建立回归方程 4 对回归方程进行各种统计检验. 5 利用回归方程进行预测. 二、线性回归分析和线性回归模型 一 一元线性回归模型 1、含义:只有一个解释变量的线性回归模型,揭示被解释变量与另一个解释变量间的线性关系。 2、数学模型 y β0+β1x+ε 6.1 该模型表明,被解释变量y的变化可由两部分解释:1)由解释变量x的变化引起y的线性变化,即y β0+β1x。2)由其他随机因素引起的y的变化,即ε,称为随机误差,是一个随机变量,满足两个前提条件: E ε 0 6.2 Var ε) σ2 6.2表明,随机误差的期望应为0,其方差应为一个特定的值。对6.1两边求期望,有E(y) β0+β1x,称为一元线性回归方程。 二、线性回归分析和线性回归模型 二 多元线性回归模型 1、含义:有多个解释变量的线性回归模型,揭示被解释变量与其他多个解释变量间的线性关系。 2、数学模型 y β0+β1x1+β2x2+…βpxp+ε 6.4 该模型表明,被解释变量y的变化可由两部分解释:1)由p个解释变量x的变化引起y的线性变化,即y β0+β1x1+β2x2+…βpxp。2)由其他随机因素引起的y的变化,即ε,称为随机误差,是一个随机变量,同样满足6.2 的要求,对6.4求期望, E(y) β0+β1x1+β2x2+…βpxp 称为多元线性回归方程。 一、回归分析概述 3、回归参数估计 目标:回归线上的观察值与预测值之间的距离总和达到最小 普通最小二乘法 利用最小二乘法拟和的回归直线与样本数据点在垂直方向上的偏离程度最低 三、回归分析的统计检验 一 一元线性回归方程 1、检验指标 回归方程拟合优度检验、回归方程的显著性检验、回归系数的显著性检验、残差分析等。 (1)回归方程的拟合优度 a、目的:检验样本观察点聚集在回归直线周围的密集程度,评价回归方程对样本数据点的拟和程度。 b、思路: 因为: 因变量取值的变化受两个因素的影响 自变量不同取值的影响 其他因素的影响 于是: 因变量总变差 自变量引起的+其他因素引起的 即: 因变量总变差 回归方程可解释的+不可解释的 可证明:因变量总离差平方和 回归平方和+剩余平方和 三、回归分析的统计检验 一 拟和优度检验 c、统计量:判定系数 R2 SSR/SST 1-SSE/SST. R2体现了回归方程所能解释的因变量变差的比例;1-R2则体现了因变量总变差中,回归方程所无法解释的比例。 R2越接近于1,则说明回归平方和占了因变量总变差平方和的绝大部分比例,因变量的变差主要由自变量的不同取值造成,回归方程对样本数据点拟合得好 在一元回归中R2 r2; 因此,从这个意义上讲,判定系数能够比较好地反映回归直线对样本数据的代表程度和线性相关性。 三、回归分析的统计检验 2、回归方程的显著性检验:F检验 1 目的:检验自变量与因变量之间的线性关系是否显著,是否可用线性模型来表示. 2 H0: β 0 即:回归系数与0无显著差异 3 利用F检验,构造F统计量: F 平均的回归平方和/平均的剩余平方和~F 1,n-1-1 如果F值较大,则说明自变量造成的因变量的线性变动远大于随机因素对因变量的影响,自变量于因变量之间的线性关系较显著 4 计算F统计量的值和相伴概率p 5 判断 p a:拒绝H0,即:回归系数与0有显著差异,自变

文档评论(0)

知识宝库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档