- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章:相关分析和回归分析PPT
河北工大廊坊分校经济系周玉江 * * SPSS统计分析方法及应用第七章 相关分析与回归分析 7.1 相关分析和回归分析概述 7.2 相关分析 7.3 偏相关分析 7.4 线性回归分析 1. 相关分析和回归分析概述 客观事物之间的关系大致可归纳为两大类,即 函数关系:指两事物之间的一种一一对应的关系,如商品的销售额和销售量之间的关系。 相关关系(统计关系):指两事物之间的一种非一一对应的关系,例如家庭收入和支出、子女身高和父母身高之间的关系等。相关关系又分为线性相关和非线性相关。 相关分析和回归分析都是分析客观事物之间相关关系的数量分析方法。 2. 相关分析 相关分析通过图形和数值两种方式,有效地揭示事物之间相关关系的强弱程度和形式。 (1)散点图 它将数据以点的的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相关关系及他们的强弱程度和方向。 (2)相关系数 利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤: 第一,计算样本相关系数r; 相关系数r的取值在-1~+1之间 R0表示两变量存在正的线性相关关系;r0表示两变量存在负的线性相关关系 R=1表示两变量存在完全正相关;r=-1表示两变量存在完全负相关;r=0表示两变量不相关 |r|0.8表示两变量有较强的线性关系; |r|0.3表示两变量之间的线性关系较弱 第二,对样本来自的两总体是否存在显著的线性关系进行推断。 (3) 计算相关系数的基本操作 【分析】--【相关】--【双变量】 (4) 相关分析应用举例 为研究高等院校人文社会科学研究中立项课题数会受哪些因素的影响,收集1999年31个省市自治区部分高校有关社科研究方面的数据,研究立项课题数(当年)与投入的具有高级职称的人年数(当年)、发表的论文数(上年)之间是否具有较强的线性关系。 对该问题的研究可以采用相关分析的方法,首先可绘制矩阵散点图;其次可以计算Pearson简单相关系数。 3. 偏相关分析 上节中的相关系数是研究两变量间线性相关性的,若还存在其他因素影响,就相关系数本身来讲,它未必是两变量间线性相关强弱的真实体现,往往有夸大的趋势。 例如,在研究商品的需求量和价格、消费者收入之间的线性关系时,需求量和价格之间的相关关系实际还包含了消费者收入对价格和商品需求量的影响。在这种情况下,单纯利用相关系数来评价变量间的相关性显然是不准确的,而需要在剔除其他相关因素影响的条件下计算变量间的相关。偏相关的意义就在于此。 1) 偏相关分析和偏相关系数 偏相关分析也称净相关分析,它在控制其他变量的线性影响的条件下分析两变量间的线性关系,所采用的工具是偏相关系数。 控制变量个数为1时,偏相关系数称一阶偏相关;当控制两个变量时,偏相关系数称为二阶偏相关;当控制变量的个数为0时,偏相关系数称为零阶偏相关,也就是简单相关系数。 2) 偏相关分析的基本操作 【分析】--【相关】--【偏相关】 4. 线性回归分析 线性回归分析的内容 能否找到一个线性组合来说明一组自变量和因变量的关系 如果能的话,这种关系的强度有多大,也就是利用自变量的线性组合来预测因变量的能力有多强 整体解释能力是否具有统计上的显著性意义 在整体解释能力显著的情况下,哪些自变量有显著意义 回归分析的一般步骤 确定回归方程中的解释变量(自变量)和被解释变量(因变量) 确定回归方程 对回归方程进行各种检验 利用回归方程进行预测 1)线性回归分析概述 2) 线性回归模型 一元线性回归模型的数学模型: 其中x为自变量;y为因变量; 为截距,即常量; 为回归系数,表明自变量对因变量的影响程度。 多元线性回归模型 多元线性回归方程: y=β0+β1x1+β2x2+...+βkxk β1、β2、βk为偏回归系数。 β1表示在其他自变量保持不变的情况下,自变量x1变动一个单位所引起的因变量y的平均变动。 选择【分析】→ 【回归】→【线性】。在左侧变量框中选择“课题总数”将其移动到因变量列表中,将自变量“移动到自变量下的方格中,如图所示。 从下表可以看出,引入模型的六个解释变量只有一个通过t检验。模型整体显著而单个系数大都不能通过t检验,这正是解释变量之间存过多重共线性的常见特征。观察表中的容差和方差膨胀因子我们可以看出六个解释变量的容差都很小接近于0,但它们的VIF都很大,这进一步证实了解释变量之间存在严重的多重共线性。 *
文档评论(0)