- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分享讲多重共线性
第五讲 多重共线性
本讲分为两个部分:第一部分是对相关性问题的研究,作为多重共线性问题的基础,第二部分则是对多重共线性问题展开讨论。
第一部分:相关理论
1.相关理论
相关分析是研究变量间相互关系的最基本方法。从相关分析中引出的相关系数是回归分析的一个基本统计量。掌握它有助于对经济问题和经济计量模型的分析与理解。
1.1 相关的定义与分类
定义:相关(correlation)指两个或两个以上变量间相互关系的程度或强度。
分类:①按强度分
完全相关:变量间存在函数关系。例,圆的周长,L = 2πr。
高度相关(强相关):变量间近似存在函数关系。例,我国家庭收入与支出的关系。
弱相关:变量间有关系但不明显。例,近年来我国耕种面积与产量。
零相关:变量间不存在任何关系。例,某班学生的学习成绩与年龄。
完全相关 高度相关、线性相关、正相关 弱相关
②按变量个数分
按形式分:线性相关, 非线性相关
简单相关:指两个变量间相关
按符号分:正相关, 负相关, 零相关
复相关(多重相关和偏相关):指三个或三个以上变量间的相关。
非线性相关 负相关 零相关
因非线性相关可以转化为线性相关处理,而复相关又可看作是简单相关基础上的拓展,所以后面重点介绍简单线性相关。
1.2 简单线性相关的度量
用简单线性相关系数,简称相关系数(correlation coefficient)度量两个变量间的线性相关强度,用 ( 表示。( 的随机变量表达式是
( =。
( 的统计表达式是
( ==
其中T,总体容量;xt, yt,变量的观测值;(x,(y,变量观测值的均值。
下面解释 ( 为什么能对变量间的线性相关强度进行定量度量。
因为 ( 表达式的分子是协方差,Cov (xt , yt);分母是xi和yt的标准差之积。而xt和yt的标准差不会为零,所以Cov (xt , yt) 是否为零,就决定了( 是否为零,即标志着变量xt, yt间是否存在线性相关关系。
但Cov(xt , yt) 有两个缺点:①它是一个有量纲的量,取值容易受测量单位的影响;②取值范围宽,相关性越强,Cov(xt , yt) 取值越大。为克服上述缺点,用xt, yt的标准差除Cov(xt , yt),于是就得到相关系数 ( 的统计表达式。它是一个无量纲量。
相关系数 ( 是对总体而言。当研究某个问题时,所得数据常是一个样本。对样本来说,相关系数常用r表示,即r是总体相关系数 ( 的估计值。
r = ==
其中T,样本容量;xt, yt,变量的观测值;,,变量观测值的均值。
11.3 相关系数的取值范围
当两个变量严格服从线性关系时,∣(∣= 1。
证:设直线斜率为k, 即y = a + k x。则有
( === 1
当两个变量不存在线性关系时,( ( ( = 0。
(3)上述是两种极端情形,所以相关系数的取值范围是 [-1,1]。当Cov (xt , yt) 0时,则 ( 0 (正相关);当Cov (xt , yt) 0时,则 ( 0 (负相关);若Cov (xt , yt) = 0,则 ( = 0 (零相关)。
为什么图1为正相关?为什么图2为负相关?用( (xt –) ( yt –)解释。
图1 正相关 图2 负相关
例1:散点图与相关系数
r = 0.64 r = 0.99
1.4 线性相关系数的局限性
(1) 只适用于考察变量间的线性相关关系。也就是说当 ( = 0时,只说明二变量间不存在线性相关关系,但不能保证不存在其它非线性相关关系。所以变量不相关与变量相互独立在概念上是不同的。
(2) 相关系数的计算是一个数学过程。它只说明二变量间的相关强度,但不能揭示这种相关性的原因,不能揭示变量间关系的实质,即变量间是否真正存在内在联系,因果关系。所以在计算r 的同时,还要强调对实际问题的分析与理解。
(3) 一般说二变量相关时,可能属于如下一种关系。
单向因果关系。如施肥量与农作物产量;对金属的加热时间与温度值。
双向因果关系
您可能关注的文档
最近下载
- 灯盏生脉胶囊配合康复训练对脑梗死患者肢体功能影响的临床观察.pdf VIP
- (高清版)-B-T 19973.1-2023 医疗保健产品灭菌 微生物学方法 第1部分:产品上微生物总数的确定.pdf VIP
- 西门子PLC与配方功能.pptx VIP
- 高中毕业生登记表(完整A4版).pdf VIP
- XX年春运驾驶员安全培训试题(有答案) .pdf VIP
- 2023年同等学力申硕全国统考计算机科学与技术真题与答案.pdf VIP
- 供应商管理:供应商行为准则的内容.doc VIP
- 机械设备行业矿山机械深度报告:千亿美元高端赛道,中国龙头迈向全球.docx
- 《黑水》完整中英文对照剧本.doc
- TOSHIBA东芝复合机e-STUDI02006产品说明书.pdf
文档评论(0)