- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概率论4.4-4.5
X和Y 独立 X和Y不(线性)相关 X和Y不独立 X和Y(线性)相关 独立性与不相关性 独立性与不相关性是讨论随机变量X与Y之间关 系的两个概念; X和Y 独立:指X与Y互不影响,没有关系; X和Y 不相关:指X与Y之间没有线性关系. X与Y独立 X与Y不相关 当(X,Y )服从二维正态分布时,即 特 例 定义: X的k阶原点矩:E(Xk) k=1, 2, … X的k阶中心矩:E{[X–E(X)]k} X和Y的k+l 阶混合原点矩:E(XkYl ) k,l=1, 2, … X和Y的k+l 阶混合中心矩: E{[X–E(X)]k [Y–E(Y)]l} 随机变量的矩 有:X 的期望 E(X) 是 X 的一阶原点矩; 方差D(X) 是 X 的二阶中心矩; 协方差Cov(X,Y)是X和Y 的二阶混合中心矩. 矩的计算:就是计算各类数学期望 协方差矩阵 定义:随机变量 X和 Y 的二阶中心矩共有四个,记作 则称矩阵 为(X, Y)的协方差矩阵,简称协方差阵。 性质:对称矩阵 类似地,我们也可定义n 维随机变量 (X1, X2, …, Xn) 的协方差阵:若随机变量的所有的二阶中心矩 为(X1, X2, …, Xn) 的协方差阵。 存在,则称矩阵 数据的特征和测度(矩的应用) 数据的特征和测度 分布的形状 离散程度 众 数 中位数 均 值 离散系数 方差和标准差 峰 度 四分位差 异众比率 偏 态 集中趋势 偏态与峰度分布的形状 扁平分布 尖峰分布 偏态 峰度 左偏分布 右偏分布 与标准正态分布比较! 偏态系数 1. 数据分布偏斜程度的测度 2. 偏态系数=0为对称分布 3. 偏态系数 0为右偏分布 4. 偏态系数 0为左偏分布 5. 计算公式为 偏态(实例) 【例】已知某年我国农村居民家庭按纯收入分组的有关数据如表。试计算偏态系数 农村居民家庭纯收入数据 按纯收入分组(元) 户数比重(%) 500以下 500~1000 1000~1500 1500~2000 2000~2500 2500~3000 3000~3500 3500~4000 4000~4500 4500~5000 5000以上 2.28 12.45 20.35 19.52 14.93 10.35 6.56 4.13 2.68 1.81 4.94 户数比重 (%) 25 20 15 10 5 农村居民家庭村收入数据的直方图 偏态与峰度(从直方图上观察) 按纯收入分组(元) 1000 500 ← 1500 2000 2500 3000 3500 4000 4500 5000 → 结论:1. 为右偏分布 2. 峰度适中 偏态系数(计算过程) 农村居民家庭纯收入数据偏态及峰度计算表 按纯收入分组 (百元) 组中值 Xi 户数比重(%) Fi (Xi- X ) 3 Fi (Xi- X ) 4Fi 5以下 5—10 10—15 15—20 20—25 25—30 30—35 35—40 40—45 45—50 50以上 2.5 7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 52.5 2.28 12.45 20.35 19.52 14.93 10.35 6.56 4.13 2.68 1.81 4.94 -154.64 -336.46 -144.87 -11.84 0.18 23.16 89.02 171.43 250.72 320.74 1481.81 2927.15 4686.51 1293.53 46.52 0.20 140.60 985.49 2755.00 5282.94 8361.98 46041.33 合计 — 100 1689.25 72521.25 偏态系数(计算结果) 根据上表数据计算得 将计算结果代入公式得 结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大 峰度(概念要点) 1. 数据分布扁平程度的测度 2. 峰度系数=3扁平程度适中 3. 峰度系数3为扁平分布 4. 峰度系数3为尖峰分布 5. 计算公式为 峰度系数系数(实例计算结果) 代入公式得 前例中,计算农村居民家庭纯收入分布的峰度系数 结论:由于=3.43,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占
文档评论(0)