- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4.5 协方差和相关系数;对于单个的随机变量我们总是关心它的平均值和方差。但是对于两个随机变量的关系,我们关心的是它们之间有没有联系,如果有联系,则联系程度有多大?;当然可以用独立性来描述两个随机变量有没有联系。但是独立这件事情是需要研究它们的联合分布,联合分布通常要有一个概率密度的函数来描述,因此相当复杂,统计学界是不喜欢用的。希望能够找到一个数字特征,单凭这个数,就能够在相当程度上知道两个随机变量的关系有多紧密。而在统计学界最喜欢用的就是协方差和相关系数。;在研究两个随机变量X与Y的关系时,通常研究它们的偏差之间的关系,即令X1=X-E(X), Y1=Y-E(Y),研究X1与Y1之间的关系,这时候E(X1)=E(Y1)=0。;在研究两个随机变量X与Y的关系时,通常研究它们的偏差之间的关系,即令X1=X-E(X), Y1=Y-E(Y),研究X1与Y1之间的关系,这时???E(X1)=E(Y1)=0。从大数定律的角度看,假设对(X1,Y1)试验了n次得到n对数(a1,b1),…,(an,bn),求它们相乘的平均值如何?即研究E(X1Y1),这时候近似有;既然X1和Y1都是0均值的,它们的试验数据一定有正数也有负数,而且正数和负数的数量大致差不多。如果X1,Y1相互独立,则式(4.35)中分子的乘积项必然也是有正有负的,因为同号相乘的机会和异号相乘的机会也都差不多,因此可想而知分子上的数据加起来会正负相消而等于0。;但是如果X1,Y1不相互独立,比如说,它们同号的机会多,则上式能够统计出一个正值来,这时可以粗糙地说X1越大则Y1越大,当然X,Y也是这个结论。而异号的机会多,则上式可以统计出一个负值来,这时可以粗糙地说X1越大则Y1越小,或者X越大Y越小。因此我们给出如下的协方差的定义和相关系数的定义。;定义 4.4设随机变量X,Y的方差都存在且大于0,则称它们的偏差相乘的数学期望为它们的协方差,用符号cov(X,Y)表示,即 cov(X,Y)=E{[X-E(X)][Y-E(Y)]} (4.36)将cov(X,Y)除以X和Y的标准差,称得到的数为X,Y的相关系数,记作rXY, 即;定理 4.3 cov(X,Y)可用下式计算 cov(X,Y)=E(XY)-E(X)E(Y) (4.38)证 由定义4.4, cov(X,Y)=E{[X-E(X)][Y-E(Y)]} =E{XY-E(X)Y-XE(Y)+E(X)E(Y)} =E(XY)-E(X)E(Y)-E(X)E(Y)+E(X)E(Y) =E(XY)-E(X)E(Y); cov(X,Y)=E(XY)-E(X)E(Y) (4.38)通常用式(4.38)计算cov(X,Y)更为省事,记忆的方法是协方差等于相乘的均值减均值的相乘。当X,Y独立时它们的协方差等于0。因此,计算cov(X,Y),首先要算出E(X),E(Y),然后将g(X,Y)=XY代入式(4.18)得如果(X,Y)是离散型随机变量,则将g(X,Y)=XY代入到式(4.19)得;定理 4.4随机变量(X,Y)的相关系数的绝对值不大于1,即|rXY|?1, 当|rXY|=1时,X-E(X)以概率1和Y-E(Y)成正比。证 令X1=X-E(X)为X的偏差,Y1=Y-E(Y)为Y的偏差,任给一常数t, X1+tY1为一随机变量,它的均方值,即平方的期望必然不小于0,即有 E[(X1+tY1)2]?0 (4.41)而上面不等式的左边展开得:;即上式右端为一t的形如at2+bt+c一元二次多项式,既然它不小于0,说明相应的一元二次方程要么没有实根,要么只有一对重的实根,其充分必要条件为方程的判别式b2-4ac?0, 对应于上面的;注意及 cov(X,Y)=E(X1Y1)则上面的不等式可以整理成即得|rXY|?1。而当|rXY|=1时,上面的所有不等式相应地都有等式,对应的一元二次方程有机会存在重根,即存在某个数k, 使得当t=k时,式(4.41)成立等式 E[(X1+kY1)2]=0 (4.42); E[(X1+kY1)2]=0 (4.42)因为式中是对一个随机变量X1+kY1的平方取数学期望都等于0,根据上一节的讨论必有X1+kY1=0以概率1成立,也就是X1与Y1以概率1成正比,证毕。;如果两个随机变量的相关系数等于0,被称之为这两个随机变量不相关,反之,就称这两个随机变量相关。当然,两个随机变量如果相互独立,就一定不相关,但是反过来不一定成立,就是说如果不相关,不一定就独立,因为独立是一种更为严格的两个随机变量毫无关系的表示。;而当相关系数的绝对值接近于1的时候,说明两个随机变量具有一定的“越…越…”的关系。在科学研究中之所以注重相关系数
您可能关注的文档
最近下载
- 赛迪译丛2024年第31期(总第657期):美国政府关键和新兴技术国家标准战略:实施路线图-加水印.pdf
- 如何抓好新形势下的意识形态工作 讲课稿.docx VIP
- 巴西国家介绍课件.pptx VIP
- 2025年新型建筑保温材料在建筑节能设计与施工中的应用报告.docx
- 酒泉汇海25万吨煤焦油深加工项目环评报告书.pdf VIP
- 十字相乘法因式分解课件.ppt VIP
- 《动物实验技术》课件——任务1:动物组织石蜡切片的制备.pptx VIP
- 矿井通风与安全专科本科生毕业设计论文.doc VIP
- 《生态环境保护与可持续发展》课件.ppt VIP
- 2025年咸宁市政务服务中心(综合窗口)人员招聘笔试备考试题及答案解析.docx VIP
原创力文档


文档评论(0)