第二章 多元总体和多元样本.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 多元总体和多元样本

第二章 多元总体和多元样本 例: 总体(身高,体重,成绩) 例: 总体(性别,籍贯(云、贵、川)) 总之,如果考查一个p元总体,就是考查这个总体中每个对象的p个属性或者说考查一个p元随机变量(p维随机向量)。 为此,需要从总体中随机地抽取n个对象(样本单元)进行观测,得到p×n个观测数据。 多元统计分析的主要任务是 1.分析各观测数据之间的关系, 2. 推断总体的某些性质。 例: 某遥感照片上,有林地占50%,水域占20%,岩裸地占30%,现从该照片中任意抽取100个象元, 分别表示其中有林地,水域,岩裸地的象元数,则: §2.2 多元样本 例: 总体(身高,体重,成绩) 例: 四、标准化数据 例: 五、离差(平方乘积和)矩阵Q和样本协方差矩阵S 例: 例: 七、二个样本的协方差矩阵 三、常用的几种统计距离 中心化不改变马氏距离 用原始数据或中心化数据算出的样本点之间的马氏距离相同. §2.4 相似系数 二、用于定性数据的相似系数 例: 总体(性别,籍贯(云、贵、川)) 由于原始数据矩阵中各行数字的单位不同,往往给数据分析造成一定困难,因此有时先将原始数据标准化,形成标准化数据。 标准化数据,是将中心化数据矩阵中的各个数据除以该行的样本标准差得到的数据,即指下述矩阵中的数据: 其中, 是原始数据矩阵中第α行的标准差。 标准化数据矩阵可以用矩阵乘法由中心化数据矩阵 算出来。即 以后,在不会经起混乱的情况下,原始数据矩阵、中心化数据矩阵或标准化数据矩阵,均可用X表示之。 最后指出一个事实:中心化及标准化数据矩阵各行数字之和都是0。 样本 (n=4) 样本平均值为: 中心化为 标准化 样本各变量标准差为: 离差(平方乘积和)矩阵 其中 易见Q是对称矩阵,并且是非负定矩阵。 样本 (n=4) 样本平均值为: 中心化为 离差平方和矩阵 样本协方差矩阵 样本协方差矩阵是一元统计学中方差的直接推广。其中非对角线元素 就是第α号变量和第β号变量的样本协方差,对角线元素sαα就是第α号变量的样本方差。 显然,S也是非负定矩阵。 样本 (n=4) 离差平方和矩阵 协方差阵 六、样本相关矩阵 其中 矩阵中非对角元素 是第α号变量与第β号变量的相关系数,对角线元素 =1 R也是对称非负定阵,因为 有时我们确定了二个样本的数据,每个样本都有n个单元,则称 为二个样本的协方差矩阵。其中 为 和 的样本协方差,即 样本协主差矩阵可以用矩阵相乘公式表示为 注意,二个样本的协方差矩阵一般不是对称的,即 ,并且 当 时,容易看出: 八、平均值和协方差矩阵的数学期望 在一元统计学中,已经证明过样本平均数是总体平均数的无偏估计; 是 的无偏估计,将此结果用于多元总体得到: 若

文档评论(0)

docman126 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档