多元统计分析课后练习答案.pdfVIP

  • 1
  • 0
  • 约1.17万字
  • 约 16页
  • 2026-02-05 发布于河北
  • 举报

第1章多元正态分布

L在数据处理时,为什么通常要进行标准化处理?

数据的标准化是将数据按比缩放,使之落入一个小的特定区

间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限

制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够

进行比较和加权。其中最典型的就是0-1标准化和Z标准化。

2.欧氏距离及马氏距离的优缺点是什么?

欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的

距离定义,它是在m组空间中两个点之间的真实距离。在二维和三维

空间中的欧氏距离的就是两点之间的距离。

缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。每

个坐标对欧氏距离的贡献是同等的。当坐标表示测量值时,它们往往

带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加

权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产

生了各种距离。当各个分量为不同性质的量时,“距离”的大小及指

标的单位有关。它将样品的不同属性之间的差别等同看待,这一点有

时不能满足实际要求。没有考虑到总体变异对距离远近的影响。

马氏距离表示数据的协方差距离。为两个服从同一分布并且其协

方差矩阵为2的随机变量及的差异程度:如果协方差矩阵为单位矩阵,

那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也

可称为正规化的欧氏距离。

优点:它不受量纲的影响,两点之间的马氏距离及原始数

据的测量单位无关。由标准化数据和中心化数据计算出的二点之间的

马氏距离相同。马氏距离还可以排除变量之间的相关性的干扰。

缺点:夸大了变化微小的变量的作用。受协方差矩阵不稳定

的影响,马氏距离并不总是能顺利计算出。

3.当变量XI和X2方向上的变差相等,且及互相独立时,采用欧

氏距离及统计距离是否一致?

统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,

能够体现各变量在变差大小上的不同,以及优势存在的相关性,还

要求距离及各变量所用的单位无关。如果各变量之间相互独立,即观

测变量的协方差矩阵是对角矩阵,则马氏距离就退化为用各个观测

指标的标准差的倒数作为权数的加权欧氏距离。

4.如果正态随机向量的协方差阵为对角阵,证明X的分量是

相互独立的随机变量。

解:因为的密度函数为

/o\

又由于£=6.

则其分量是相互独立。

(a)和是相互独立的随机变量,且〜,〜。

(b)求。的分布。

如果,写出关于及的表达式,并写出的分布。

如果且〜,写出关于及的表达式,并写出的分布。

解:(a)由于所以

(b)由于~~;

所以殳厂!〜N(0,1);

第2章故,且〜

第3章均值向量和协差阵的检验

1、略

2.试谈Wilks统计量在多元差分析中的重要意义。

3.题目此略

多元均值检验,从题意知道,容量为9的样本,总体协差未知

假设HO:,Hl:(n=9p=5)

J统计量72=(-1)血歹-⑷S-gx”)]/(

服从P,n-1的分布

统计量实际上是样本均值及已知总体均值之间的马氏距离再乘以

n*(nT),这个值越大,相等的可能性越小,各择假设成立时,有

变大的趋势,所以拒绝域选择值较大的右侧部分,也可以转变为F

统计量

零假设的拒绝区域{(n-p)/[(nT)*p]}*尸)耳,口心)

2

1/10*TF5,4(5)

(6212.0132.87

文档评论(0)

1亿VIP精品文档

相关文档