4.3协方差及相关系数.pptVIP

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三节 协方差及相关系数 性质2: |ρXY|=1 的充要条件是,存在常数a,b使得P{Y=a+bX}=1 A:0 B:1 C:-1 D:1或-1 目录 上页 下页 结束 概率统计教研室 目录页 上一页 下一页 结束页 一、协方差与相关系数的概念及性质 二、相关系数的意义 三、小结 协方差和相关系数 1. 问题的提出 一、协方差与相关系数的概念及性质 对于二维随机向量(X,Y)来说,数学期望只反映了X与Y各自的平均值,方差只反映了X与Y各自离开均值的偏离程度,它们对X与Y之间相互关系不提供任何信息. 但二维随机向量(X,Y)的概率密度f(x,y)或分布律pij全面地描述了(X,Y)的统计规律,也包含有X与Y之间关系的信息.我们希望有一个数字特征能够在一定程度上反映这种联系. 在讨论这个问题之前,我们先看一个例子。在研究子女与父母的相象程度时,有一项是关于父亲的身高和其成年儿子身高的关系。 1. 问题的提出 这里有两个变量,一个是父亲的身高,一个是成年儿子身高.为了研究二者关系,英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高的数据, 画出了一张散点图。 儿子的身高 父亲的身高 问:父亲及其成年儿子身高存在怎样的关系呢? father son 1. 问题的提出 类似的问题有: 1、吸烟和患肺癌有什么关系? 2、受教育程度和失业有什么关系? 3、高考入学分数和大学学习成绩有什么关系? …… ??? 协方差 1. 问题的提出 因此,方差是协方差的特例,协方差刻画两个随机变量之间的“某种”关系. 2. 定义 特别, 若X=Y,则 cov(X,X)=E(X-E(X))2=D(X) 对两个随机向量(X,Y),若 存在,则称 为X和Y的协方差. 对于任意随机变量X与Y,总有 由协方差定义得 这是计算协方差的常用公式. 可见,若X与Y独立,则 Cov(X,Y)= 0 . Cov(X,Y)=E(XY)-E(X)E(Y) 3. 计算 (4) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y) (2) Cov(X,X)=D(X) 4.协方差的性质 (3) Cov(aX,bY)=abCov(X,Y) 其中 a、b是常数 (1) Cov(X,Y)=Cov(Y,X) (对称性) 特别的: Cov(X,c)=0 (c为常数) (5) 若X与Y独立,则 Cov(X,Y)= 0 . 协方差的数值在一定程度上反映了X与Y相互间的联系,但它受X与Y本身数值大小的影响.如令X*=kX, Y*=kY,这时X*与Y*间的相互联系和X与Y的相互联系应该是一样的,但是 Cov(X*,Y*)=k2Cov(X,Y) 为了克服这一缺点,在计算X与Y的协方差之前,先对X与Y进行标准化: 再来计算X*和Y*的协方差,这样就引进了相关系数的概念. 为随机变量X和Y的相关系数 (correlation confficient). 1.定义:若D(X)0, D(Y)0,且Cov(X,Y)存在时,称 在不致引起混淆时,记 为 . 二、相关系数 考虑以X的线性函数a+bX来近似表示Y.以均方误差 e=E{[Y-(a+bX)]2} =E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y) 来衡量以a+bX近似表达Y的好坏程度.e的值越小表示a+bX与Y的近似程度越好.为此令 从而得 2. 相关系数的性质 性质1:随机变量X和Y的相关系数满足|ρXY|≤1. 证明 由 可知 证明:(1)若|ρXY|=1,则由 (2) 若存在常数a*,b*使得P{Y=a*+b*X}=1,则有P{[Y-(a*+b*X)]2=0}=1.即得E {[Y-(a*+b*X)]2}= 0,又由 即得 |ρXY|=1 注意 |ρXY| 的大小反映了X,Y之间线性关系的密切程度: ρXY=0时, X,Y之间无线性关系; |ρXY|=1时,X,Y之间具有线性关系. ρXY0,X,Y正相关 ρXY0,X,Y负相关 ρXY ≠0,X,Y相关 ρXY=0,X,Y不相关 (ρXY=1,X,Y完全正相关) (ρXY=-1,X,Y完全负相关) x y 0 完全正相关 Y=aX+b a0 x y 0 完全负相关 Y=aX+b a0 x y 0 完全不相关 x y 0

文档评论(0)

676200 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档