多元统计分析随机向量.pptVIP

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、欧氏距离 向量的各分量如果单位不全相同,则上述欧氏距离一般就没有意义。即使单位全相同,但如果各分量的变异性差异很大,则变异性大的分量在欧氏距离的平方和中起着决定性的作用,而变异性小的分量却几乎不起什么作用。 在实际应用中,为了消除单位的影响和均等地对待每一分量,我们常须先对各分量作标准化变换,然后再计算欧氏距离。 令 ,则 由于 , 故平方和 中各项的平均取值均为1,从而各分量所起的平均作用都一样。 欧氏距离经变量的标准化之后能够消除各变量的单位或方差差异的影响,但不能消除变量之间相关性的影响,以致有时用欧氏距离显得不太合适。为此,我们引入一个由印度著名统计学家马哈拉诺比斯(Mahalanobis,1936年)提出的“马氏距离”的概念。 一、欧氏距离 二、马氏距离 之间的平方马氏距离定义为: 到总体π的平方马氏距离定义为: 比例单位变换 如X的分量是长度、重量、速度、费用和用时等,则变量的单位变换可表达为: 其中 。 带有常数项的单位变换 例子 摄氏温度与华氏温度的换算公式: F=(C×9/5)+32 , C=(F-32)×5/9 式中F——华氏温度,C——摄氏温度。 特点1. 马氏距离不受变量单位的影响,是一个无单位的数值 。 证明 X1 , X2经单位变换后为Y1 , Y2 ,即有 特点2. 马氏距离是X和Y经“标准化”之后的欧氏距离,即 其中 ,它们的均值 皆为0,协差阵皆为单位阵I。 特点3. 若 ,则 即当各分量不相关时马氏距离即为各分量经标准化后的欧氏距离。 1.马氏距离的计算是建立在总体样本的基础上的,也就是说,如果拿同样的两个样本,放入两个不同的总体中,最后计算得出的两个样本间的马氏距离通常是不相同的,除非这两个总体的协方差矩阵碰巧相同。? 2.在计算马氏距离过程中,要求总体样本数大于样本的维数,否则得到的总体样本协方差矩阵逆矩阵不存在,这种情况下,用欧式距离计算即可。? 3. 协方差矩阵的逆矩阵不存在,比如三个样本点(3,4),(5,6)和(7,8)这种情况是因为这三个样本在其所处的二维空间平面内共线。这种情况下,也采用欧式距离计算。? 4.在实际应用中,绝大多数情况下马氏距离是可以顺利计算的,但是马氏距离的计算是不稳定的,不稳定的来源是协方差矩阵,这也是马氏距离与欧式距离的最大差异之处。?  马氏距离的优缺点 优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关;由标准化数据和中心化数据(即原始数据与均值之差)计算出的二点之间的马氏距离相同。马氏距离还可以排除变量之间的相关性的干扰。? 缺点:夸大了变化微小的变量的作用。 §2.5 随机向量的变换 设 在区间 I 以外恒为0 ( I 有限或无限); 在区间 I 上的值域为 在区间 I 上单调可导; 其反函数记为 则 的密度为: §2.5 随机向量的变换 将上述结果推广到随机向量, 则 §2.5 随机向量的变换 例4 设y=Ax+b,其中A为p阶常数矩阵,b为p维常数向量,则 EXERCISES 在实际问题中,有时|Σ|=0,其原因是指标之间存在着线性关系,如某一指标是其他一些指标的汇总值,这在一般数据报表中是常出现的。我们通常可以通过删去“多余”指标的办法来确保|Σ|≠0。因此,我们总假定 Σ0并不失一般性,这样可保证Σ?1存在,从而可使数学问题得以简化。 * * * 单击此处编辑母版标题样式 单击此处编辑母版标题样式 附2 随机向量 §2.1 一元分布 §2.2 多元分布 §2.3 数字特征 §2.4 欧氏距离和马氏距离 §2.5 随机向量的变换 §2.6 特征函数(不讲) §2.2 多元分布 一、多元概率分布 二、多元概率密度函数 三、边缘分布 四、条件分布 五、独立性 一、多元概率分布 随机向量:元素为随机变量的向量。 随机矩阵:元素为随机变量的矩阵。 随机变量X的分布

文档评论(0)

celkhn0210 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档