[理学]spss第6章.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]spss第6章

第6章 相关分析与回归分析 学习内容 相关分析及其显著性检验 一元线性回归分析 多元线性回归分析 知识回顾 相关分析与回归分析用于找出变量之间的函数共变关系,检验变量之间的密切程度。 相关分析是分析变量之间的相关性。 回归分析是分析当变量间存在相关性时,确定变量之间的数学模型(数学方程),从而分析某个变量的变异在多大程度上由其他变量的变异进行预测。 回归模型的类型 案例 设有10个厂家的投入和产出如下,根据这些数据,我们可以认为投入和产出之间存在相关性吗? 技术人员想通过以上数据探索产出 与投入是否存在某种关系? 一、相关分析 研究变量的相关关系,通过求相关系数,构造散点图来反映它们之间的相关程度。 简单相关(两个变量或多个变量之间两两之间的相关关系) 偏相关(控制一个或几个变量对研究变量的影响来分析其他两个变量的相关关系) 相关关系类型 散点图 相关系数 相关系数:对变量之间关系密切程度的度量 r 样本相关系数  总体相关系数 r的取值范围是 [-1,1]: 完全相关 /完全正相关 /完全负相关 /不存在线性相关关系 /负相关 /正相关 r的取值 r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r = -1,为完全负正相关 r = 0,不存在线性相关关系相关 -1? r 0,为负相关 0 r ?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 相关系数的显著性检验 提出假设 : =0 计算检验的统计量 确定显著性水平 ,并作出决策 若?t? ,拒绝; 若?t? ,接受 6.1.1 适用条件 不同数据类型用不同的相关计算方法 定类数据:斯皮尔曼 定量数据:皮尔逊 表6.1.1 6.1.2 例题:简单相关分析 分析X6~X18这13个变量两两之间是否存在显著相关。 结果分析 结论 如: X9与X7 、X8之间显著相关 X6与X11、X13、X17之间显著相关。 …… 6.1.3 例题:偏相关分析 控制X19(满意度)之后,X21和X22之间是否存在显著相关。 结果分析 结论 控制了满意度评价后, 顾客继续购买该产品的可能性与顾客对该产品的需求量的相关不显著。 二、回归分析 研究变量之间的数量关系,用一个变量的变化来预测另一个变量的变化。 步骤: 确定回归模型 求出估计的回归方程 回归方程的显著性检验 回归系数的显著性检验 利用回归方程进行估计与预测 一元线性回归 一元线性回归(Linear regression),只研究一个自变量与一个因变量之间的统计关系。 回归模型为: b0和b1称为回归参数;e是误差项(残差) b0是回归直线在y轴上的截距,是当x=0时y的期望 值; b1是直线的斜率,称为回归系数,表示当x每 变动一个单位时,y的平均变动值。 总体回归参数b0和b1是未知的,必需利用样本数据去估计。用样本统计量b0和b1代替回归方程中的未知参数b0和b1 ,就得到了估计的回归方程: b0是估计的回归直线在轴上的截距, b1是直线的斜率。 b0和b1是b0和b1的估计值 是y的估计值 用最小二乘法来得到一个表示厂家投入与产出关系的线性方程。当厂家的投入为20时,它的预测产出是多少? 故回归方程为 预测值是将x值代入直线回归方程解得的值。若投入为20,他的预测产出应该为: 同理可以计算出其他情况下的预测产出,每组数据的预测值列出在下表中第3列: 通过对残差进行检验,我们对回归直线与数据点的拟合情况有进一步了解。 有时残差也用来确定异常点(outliers),异常点就是与其他点偏离,与总体趋势不符的数据点。异常点往往使残差幅度加大,在散点图中很容易识别。回归直线方程会受到计算中每个点的影响,因此,异常点的存在可能会使回归直线向异常点偏离。 回归方程的显著性检验 得到了 后,不能直接用它来作预测,需要先它进行检验。 回归方程的显著性检验,就是检验自变量和因变量之间的线性关系是否显著。 (1)提出假设 H0:β1=0(自变量与因变量的线性关系不显著); H1: β1≠0(两者线性关系显著) (2)计算检验统计量F: (3)确定显著性水平?,并根据分子自由度1和分母自由度n-2找出临界值Fa; (4)作出决策:若 拒绝H0 ;若 接受H0 。 在回归分析中通常计算F值来检验模型总体的显著性,在多元回归中,F用来检验是否至少有一个回归系数(因为有多个回归系数)不为0。

文档评论(0)

ipbohn97 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档