- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
社会经济统计学(第九章)
第九章 相关与回归分析 第一节 相关与回归分析的一般问题 第二节 简单线性相关分析 第三节 简单线性回归分析 第一节 相关与回归的一般问题 一、相关关系与相关分析 (一)相关关系的概念与特点 相关关系是指现象之间存在的一种关系数值不固定的、 数量上的依存关系. 首先,现象之间确实存在一种数量上的依存关系。 自变量:作为依据的变量; 因变量:发生相应变化的变量. 其次,变量之间存在相关关系,且数值是不固定的 函数关系 (二)相关关系的种类 1.按涉及的变量的多少:单相关与复相关 2.表现形式分:线性相关与非线性相关。 3.按方向不同分:正相关与负相关。 4.按相关程度来分:完全相关、不完全相关和不相关。 完全相关:r=±1 不相关: r=0 (三)相关分析的概念和内容 相关分析是研究具有相关关系的变量之间变动方向 和密切程度的统计分析方法。 主要内容: 第一,判定变量之间是否存在相关关系以及相关关系的形式 通过相关表和相关图来实现 第二,确定变量之间相关的密切程度 通过计算相关系数来实现 二、回归与回归分析 (一)回归的含义 指变量之间的数量关系 (二)回归分析的概念和内容 回归分析是对具有相关关系的变量之间数量变化的一般 关系进行计算,确定一个相应数学表达式,以进行估计或预 测的方法。内容: 第一,对具有相关关系的现象选择合适的数学模型 第二,对所选择的数学模型的实际效果进行准确性和可靠性检验。 可通过假设检验和估计标准误差来实现 (三)类型 1.按涉及变量的多少:简单回归和复合回归 2.按变量的表现形式:直线回归和曲线回归 三、相关分析与回归分析的关系 联系:都是以变量之间的相互依存关系作为研究对象,相关关系是回归分析的前提和基础,回归分析是相关分析的深入和继续。 区别: 1.相关分析没有方向性,是对等关系;回归分析有方向性,必须先确定自变量与因变量 2.相关分析中变量是随机变量;回归分析则不同,自变量是给定的,因变量是随机的 第二节 简单线性相关分析 一、简单线性相关关系的直观判断 采用定性和定量分析的方法:受理论知识、专业水平、实践经验和分析问题的能力等影响。 采用相关表和相关图 1.相关表 2.相关图(散点图) 可以观察两个变量之间是否存在相关关系以及相互密切 程度如何。 二、相关系数的计算方法和判断标准 (一)计算公式 相关系数是用来测定并反映两个变量之间线性相关 密切程度的指标。用r表示。 (二)直线相关系数的判断标准 相关系数的取值范围:-1≤r≤+1 当r=0,X与Y之间无线性相关 当r=1,X与Y之间完全正相关 当0r1,X与Y之间不完全正相关 当r=-1,X与Y之间完全负相关 当-1r0,X与Y之间不完全负相关 高度相关、中度相关、低度相关、弱相关 防止伪相关 直线相关系数一般仅适用于测定变量间的线性相关,曲线相关,则用相关指数R 例:10个学徒工的技术操作训练时间和月产量资料如 下,计算其相关系数 第三节 简单线性回归分析 回归分析是研究自变量与因变量之间变动关系 的一种统计方法。有线性回归方程和非线性回归方 程。简单线性回归方程是描述两个变量之间的线性 关系的方程,应用最广泛。 一、回归直线的确定 判定存在线性关系:Yc=a+bX 若X与Y互为因果关系,还可求出另一直线方程: 求出待定参数a,b b的含义:说明自变量每增加(减少)一定的数值,因变量平均增加(减少)的数值。 例: 相关系数与回归系数b的关系 二、回归直线的代表性分析 (一)总变差的分解 对每个观点都进行同样的分解,然后求和 总变差ST 回归变差,以SR表示: 表示估计值YC与平均值Y的离差平方和,它说明各个估计值 YC的变动是由于X的变动而引起的变动程度,说明SR是由X 与Y的直线回归关系引起的; 剩余变差,以SE表示 表示各观察值与估计值的离差平方和,表示各观察值Y围 绕回归直线YC=a+bX的变动程度,它是除了X对Y的线性影响 之外的一切随机因素所引起的Y的变动。 总变差(ST)=回归变差(SR)+剩余变差(SE) (二)可决系数和相关指数 回归变差占总变差的比重越大,说明观察值离回归 直线越近,用自变量X通过回归方程求得其相应YC值去估 计实际值Y就越精确,说明X与Y之间关系越密切,回归直 线的代表性越好。用以衡量X与Y之间相关关系的密切程 度以及回归直线拟合的优劣程度,称为可决系数,用R2 表示。 由比例关系可知:当X与Y完全相关时,对样本的观察值 来说,Y的实际观察值与Y的估计值是一致的,此时剩余变差 为0,可决系数
文档评论(0)