补充—相关理论.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关理论 主要内容 定义与分类 线性相关的度量 相关系数的取值 相关系数的局限性 相关系数的检验 1.相关的定义与分类 定义:相关(correlation)指两个或两个以上变量间相互关系的程度或强度。 分类:①按强度分 完全相关 变量间存在函数关系。例,圆的周长,L = 2πR 高度相关(强相关) 变量间近似存在函数关系。例,我国家庭收入与支出的关系。 弱相关 变量间有关系但不明显。例,近年来我国耕种面积与产量。 零相关 变量间不存在任何关系。例,某班学生的学习成绩与年龄。 分类 ②按变量个数分 简单相关:指两个变量间相关 按形式分:线性相关, 非线性相关 按符号分:正相关, 负相关, 零相关 复相关(多重相关和偏相关):指三个或三个以上变量间的相关。 相关图 相关图 相关图 2.简单线性相关的度量 简单线性相关系数,简称相关系数(correlation coefficient)度量了两个变量间的线性相关强度,用 ? 表示。 ? 的随机变量表达式是 相关系数的表达式 ? 的统计表达式 ? 为什么能对变量间的线性相关强度进行定量度量 因为 ? 表达式的分子是协方差,Cov (xt , yt);分母是xt和yt的标准差之积。而xt和yt的标准差不会为零,所以Cov (xt , yt) 是否为零,就决定了? 是否为零,即标志着变量xt, yt间是否存在线性相关关系。 但Cov(xt , yt) 有两个缺点:①它是一个有量纲的量,取值容易受测量单位的影响;②取值范围宽,相关性越强,Cov(xt , yt) 取值越大。为克服上述缺点,用xt, yt的标准差除Cov(xt , yt),于是就得到相关系数 ? 的统计表达式。它是一个无量纲量。 样本相关系数 相关系数 ? 是对总体而言。当研究某个问题时,所得数据常是一个样本。对样本来说,相关系数常用r表示,即r是总体相关系数 ? 的估计值。 3.相关系数的取值范围 (1)当两个变量严格服从线性关系时,∣?∣= 1。 证:设直线斜率为k, 即y = a + k x。则有 3.相关系数的取值范围 (2)当两个变量不存在线性关系时,? ? ? =0。 (3)上述是两种极端情形,所以相关系数的取值范围是 [-1,1]。 当Cov (xt , yt) 0时,则 ? 0 (正相关); 当Cov(xt , yt) 0时,则 ? 0 (负相关); 若Cov(xt , yt) = 0,则 ? = 0 (零相关)。 用? (xt – ) ( yt – )解释 正相关与负相关 4.线性相关系数的局限性 (1) 只适用于考察变量间的线性相关关系。也就是说当 ? = 0时,只说明二变量间不存在线性相关关系,但不能保证不存在其它非线性相关关系。所以变量不相关与变量相互独立在概念上是不同的。 (2) 相关系数的计算是一个数学过程。它只说明二变量间的相关强度,但不能揭示这种相关性的原因,不能揭示变量间关系的实质,即变量间是否真正存在内在联系,因果关系。所以在计算r 的同时,还要强调对实际问题的分析与理解。 (3) 一般说二变量相关时,可能属于如下一种关系。 ①单向因果关系。如施肥量与农作物产量;对金属的加热时间与温度值。 ②双向因果关系。如工业生产与农业生产;商品供给量与商品价格。 ③ 另有隐含因素影响二变量变化。如市场上计算机销量与电视机销量呈正相关。显然人均收入的增加是一个隐含因素。 ④ 虚假相关。如年国内生产总值与刑事案件数呈正相关。显然二变量间不存在因果关系。应属虚假相关。中国和美国某个经济指标高度相关,显然这没有可比性,毫无意义。 5.简单相关系数的检验 (1) 直接检验(查相关系数临界值表) H0:? = 0; H1:? ? 0 用xt和yt的样本计算相关系数r,以自由度f = T - 2查临界值表。 检验规则是 若 ? r ? r? (T-2) (临界值),则xt和yt相关; 若 ? r ? r? (T-2) (临界值),则xt和yt不相关。 相关系数检验 (2) t 检验 H0:? = 0; H1:? ? 0 其中2表示涉及两个变量。 若 ? t ? t? (T-2) ,则xt和yt相关; 若 ? t ? t? (T-2) ,则xt和yt不相关。 6.偏相关系数 以上介绍了简单线性相关系数,但是当两个变量xt, yt同时受其它变量z1t, z2t, …, 影响时,有必要研究当控制其它变量z1t, z2t, …,不变时,该两个变量xt, yt之间的相关关系。称这种相关关系为偏相关关系。以3个变量xt, yt, zt,为例(多于3个变量的情形与此相似。) 测量思路 假定控制zt不变

文档评论(0)

bhl0572 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档