第三章§33协方差,相关系数.pptVIP

  • 1
  • 0
  • 约 48页
  • 2016-12-03 发布于重庆
  • 举报
第三章§33协方差,相关系数

相关系数的性质 小结 大量的随机现象中平均结果的稳定性 大数定律的客观背景 大量抛掷硬币 正面出现频率 字母使用频率 生产过程中的 废品率 …… “大数”就是指涉及大量数目的观察值,它表明大数定律中所指出的现象,只有在大量次数的试验和观察之下才成立。 例如,一所大学里有上万名学生,如果随意地观察一个学生的身高X1,则X1与全校学生的平均身高a可能相差甚远;如果观察10个学生的身高并取其平均,则它就有更大的机会与a更接近;如果观察100个学生,则这100个人的平均身高将与a更加接近,这是我们在日常经验中所体会到的事实,大数定律正是对这一事实从理论上进行的概括和论证。 在实践中人们认识到大量测量值的算术平均值也具有稳定性,而这种稳定性就是本节所要讨论的大数定律的客观背景,而这些理论正是概率论的理论基础。 大数定律以确切的数学形式表达了这种规律性,并论证了它的成立条件,即从理论上阐述了这种大量的、在一定条件下的、重复的随机现象呈现的规律性即稳定性。由于大数定律的作用,大量随机因素的总体作用必然导致某种不依赖于个别随机事件的结果。 迄今为止,人们已发现很多大数定律(laws of large numbers)。所谓大数定律,简单地说,就是大量数目的随机变量所呈现出的规律,这种规律一般用随机变量序列的某种收敛性来刻画。 下面,先介绍一个重要的基本概念和一个重要的不等式: 依概率收敛性 切比雪夫不等式 定义1 若存在常数a,使对任给常数 ,有 则称随机变量序列 依概率收敛于a 。 当n充分大时,几乎所有的 都落在a的 邻域内。 抛硬币试验的频率稳定性 说明1 说明2 切比雪夫(Chebyshev) 不等式 设? 的期望E?和方差D?存在,则对任给常数 , 有 或 证 (对连续型) 设 ~ 则 切比雪夫(Chebyshev) 不等式 * * 第三章 随机变量的数字特征 §3.3 协方差和相关系数(续) 定义 设 为二维随机变量,如果 存在,称其为 与 的协方差,记为 协方差 内容复习 用公式 协方差性质: 协方差 注: 1° 协方差可正、可负、可为零。 2° 受量纲的影响,不便于实际应用。 为了方便应用,消除了量纲的影响 ? 与 ? 的相关系数 定义3.5 (P.95)设 ,则称 为 ? 与 ? 的相关系数。 相关系数 例4. 解:1) 例4. 解:2) 例4. 解:3) 例4. 以上结果说明了什么现象? 相关系数刻划了两个变量间线性相关程度 P.100 解 因 所以 例5. 故 (1). |ρXY|≤1,即“相关系数的绝对值不大于1”。 方差的非负性 证明 (2). 若? 与 ? 相互独立, 则 证明 定义 若 则称 ? 与 ?不相关。 注: ?与?相互独立 ?与?不相关 见 P.96 例1 P.96 例6 所以? 与 ? 的相关系数 即? 与 ? 不相关。 但? 与 ? 也不独立,因为 ? 2° ?与?相互独立 ?与?不相关 例1 但 二元正态分布除外 ~ 设 ,则 ? ? 是 ? 与 ?的相关系数; ? ? 与 ?相互独立 ? ?=0。 ?与?不独立 证明(充分性) 设η=aξ+b ,则E(η)=aE(ξ)+b,D(η)=a2D(ξ) 即 | ρξη |=1 (必要性(略)) (3).|ρξη|=1的充分必要条件是ξ与η以概率1存在线性关系, 即 P(η=aξ+b)=1,a≠0,a,b为常数。 即X与Y以概率1存在线性关系,此时称X,Y正线性相关。 当ρXY=-1时 即X与Y以概率1存在线性关系,此时称X,Y负线性相关。 (3).|ρXY|=1的充分必要条件是X与Y以概率1存在线性关系,即 P(Y=aX+b)=1,a≠0,a,b为常数。 当ρXY=1 一般有 当ρXY 0 称X,Y正相关。 当ρXY 0 称X,Y负相关。 当ρXY =0 称X,Y不相关。 ? ? ? ? ? ° ° ° ° ° 相关系数 只能说明?与?无线性关系 例4.中 小结 这一节我们介绍了协方差、相关系数、 相关系数是刻划两个变量间线性相关程度的一个重要的数字特征. 注意独立与不相关并不是等价的. 当(X,

文档评论(0)

1亿VIP精品文档

相关文档