第8章 相关分析.pptVIP

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
40 45 50 55 60 65 70 75 155 160 165 170 175 180 X Y 2020/5/14 31 X Y 协方差为大的负值时,表 示强的负线性相关关系。 31 对协方差的理解 [ ][ ] XY X Y E X Y ? ? ? ? ? ? cm kg mm kg 大 于 基本结论:协方差受计量单位和数量级 水平的影响,从而不能真实反映相关的 程度。 [ ][ ] XY X Y E X Y ? ? ? ? ? ? 2020/5/14 32 32 ? 相关系数( correlation coefficient ):是 协方差与两变量标准差乘积的比值,是 没有量纲的、标准化的协方差。 总体相关系数 样本相关系数 ? ?? ? ? ? ? ? 2 2 2 XY X Y X Y X Y X Y X Y ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 2 2 2 ( )( ) ( ) ( ) xy x y i i i i s r s s x x y y x x y y ? ? ? ? ? ? ? ? 常数 一致估 计量 2020/5/14 33 33 ? Spearman 等级相关系数 : – 用来度量 定序变量 间的线性相关关系。 例如, 不同年龄段与不同收入段等。 – Spearman 相关系数又称秩相关系数,是利用两 变量的秩次大小作线性相关分析,对原始变量 的分布不作要求,属于非参数统计方法,适用 范围要广些。 34 ? 设计思想: – 利用秩 ( 数据的排序次序 ) 。认为 : 如果 x 与 y 相 关 , 则相应的秩 U i 、 V i 也具有同步性 . ? 首先得到两变量中各数据的秩 ( U i 、 V i ), ? 利用数据的秩( U i 、 V i )代替原始数据 ( x i , y i )代入 Pearson r 公式中,有: ? ? ? ? ? ? n i i i n i i V U D 1 2 1 2 ) ( 2 1 2 2 2 6 ( )( ) 1 ( 1) ( ) ( ) n i i i i i i D U U V V r n n U U V V ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 35 编号 X Y 1 2 27 2 1 14 3 3 19 4 7 47 5 5 22 36 编号 X U i Y V i D i D 2 2 1 1 14 1 0 0 1 2 2 27 4 - 2 4 3 3 3 19 2 1 1 5 5 4 22 3 - 1 1 4 7 5 47 5 0 0 ? ? 2 6 6 1 0.7 5 5 1 r ? ? ? ? ? 37 ? 当两变量为完全负线性相关时, U i +V i =n+1 ? 当两变量为完全正线性相关时, U i =V i , 2 1 n i i D ? ? ? ? ? ? ? ? n i i i n i i V U D 1 2 1 2 ) ( 达到最小为 0 , r=1 ; 达到最大为 2 2 1 1 ( 1), 1 3 n i i D n n r ? ? ? ? ? ? 38 ? 若两变量存在强正相关性 , 则 D i 2 应较小 , 秩序相关系数 较大,趋向于 1 ; ? 若两变量存在强负相关性 , 则 D i 2 应较大 , 秩序相关系 数为负,绝对值较大; ? 若两变量的相关性较弱,它们秩的变换不具有同步 性,于是 D i 2 应较大, r 趋向于 0 。 ) 1 ( 6 1 2 2 ? ? ? ? n n D r i ? ? ? ? ? ? n i i i n i i V U D 1 2 1 2 ) ( 39 ? Kendall 相关系数 : – 度量 定序变量 间的线性相关关系。 – 计算步骤: 首先计算一致对数目 (U) 和非一致对数目 (V) ; 如 : 对 x 和 y 求秩后为 : x: 2 4 3 5 1 y: 3 4 1 5 2 x 的秩按自然顺序排序后 : x: 1 2 3 4 5 y: 2 3 1 4 5 然后计算 Kendall 相关系数: ? ? 2 ( 1) U V n n ? ? ? ? ? 40 ? 若两变量存在正强相关性 , 则 V 较小 , 秩序 相关系数较大 ; 若两变量存在强负相关性 , 则 V 较大 , 秩序相关系数为负 , 绝对值较大。 41 相关系数检验 ? 一般情况下,总体相关系数是未知的,通常用 r 作为 的近似值。但由于 r 是根据样本计算出来的, 它受抽样误差的影响。由于抽取的样本不同, r 的 取值也不同,能否用 r 说明总体的相关程度呢? 这就需要考查 r 的可靠

文档评论(0)

zhaohuifei + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档