多元统计分析试题.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

一、填空题(30分):

1、多元正态分布检验用到的三大分布为、、o

2、若X?N〃(4,Z),则AX+d~o(服从什么分布)

3、常用的聚类方法有、动态聚类、等。

4、我们将变量的类型按照尺度可分为、、三类。

5、统计距离公式为o

6、相似系数一般有、两种测度。

7、常用的多元数据图表示法有、、o

二、计算证明题(30分):

1、设抽取5个样本,每个样本只检测一个指标,他们是13,14,15.5,19,21o试用

最短距离法对5个样本进行分类并画出谱系图。71

°11

2、试验证函数/(X,九2,*3)=即+6刍+-玉工2,其中0XI1,0犬22,0工3一为随

3

机向量X=(X1,X2,X3)的密度函数。11

3、证明Gov(X,5y)=Cw(X,y)B。15

《多元统计分析》简答题

1、试简单比较一元正态总体单样本均值检验和多元正态总体均值检

验。(方差或协差阵未知时,应包括所用到的统计量,有何联系等内

容)34

一元正态总体样本均值的检验(方差未知时):

当〃未知时,用S2=-^—Y(Xi-X)2 (3.2)

作为/的估计量,用统寸量:

;在4册 (3.3)

S

来做检验。当假设成立时,统计量/服从自由度为〃-1的,分布,

从而否定域为111%25T),%2(〃—1)为自由度为〃T的,分布

上的。/2分位点。

这里我们应该注意数(33)式可以表示为

t2=丁)=X-^\S2Y\X-//) (3.4)

对于多元变量而言,可以将,分布推广为下面将要介绍的

HotellingT~分布。

多元正态总体均值检验:

(-)协差阵E未知时均值向量的检验

():ji=%(%为已知向量)H}:No

假设“。成立,检验统计量为

(〃:1):〃+1尸?尸(p,〃—p) (3.7)

(〃一1)〃

其中,T2=(n-1)LV^(X-Ji()ys-1V^(x-ji())J

给定检验水平a,查产分布表,使定[-〃二二a,可

[5-l)pJ

确定出临界值尸a,再用样本值计算出72,若〃二〃-屑〉

(〃-1)〃

则否定“。,否则接受“0。

2、简单描述一下欧氏距离、统计距离和马氏距离的定义并比较他们

的优缺点。64

欧氏距离:

P 、

4(2)=(£[居一为))】

优缺点:

要求一个向量的n个分量是不相关的并且具有相同的方差或者说各坐标对欧氏距离的同等

的并且变差大小也是相同的这是使用欧氏距离才合适效果也最好,否则就可能不能反映真

实情况甚至导致错误结论。

明氏距离

(3)

(3)

(3)

(3)

%(,)=(£

E

明氏的缺点:

(1)量纲对距离的影响。

(2)指标的相关性的影响。

一般,要求指标是不相关的,并且方差相同。(注:为了矫正方差,提出统计距离。)

统计距离:

马氏距离:设我与分是来自均值向量为〃,协方差为E=(0)的总体

G中的0维样品,则两个样品间的马氏距离为

4(A7)=(X--X.yE-,(X,-X/)

优缺点:

既排除了各指标之间相关性的干扰而且还不受个指标量纲的影响;将原数据做一线性交换

后马氏距离仍不变。

1、试比较因子分析中因子载荷、变量共同度、公共因子的方差贡献

的意义。

答:(1)Z,=%/(载荷矩阵中第i行,第j列的元素)反映了第

i个变量与第j个公共因子的相关重要性。绝对值越大,相关的密切

程度越高

(2)所有的公共因子和特殊因子对变量X,的贡献为1。如果非

./=

常靠近1,。;非常小,则因子分析的效果好,从原变量空间到公共因

子空间的转化性质好

因子载荷矩阵中各列元素的平方和

Sj~£鼎

Ji=\ 」

称为尸/ =…,加)对所有的X, 的方差贡献和。衡郭

的相对重耍性。

(4)

(4)因子旋转

2、简述逐步判别法的基本思想。

答:采用“有进有出”的算法,逐步引入变量,每次引入一个变量进

入判别式,则同时考虑在较早引入判别式的某些作用不显著的变量剔

除出去

3、简述主成分分析模型和基本步骤。

(1)假设我们所讨论的实际问题中,有p个指标,我们把这p个指

标看作P个随机变量,记为XLX2,…,Xp,主成分分析就是要把

这P个指标的问题,转变为讨论P个指标的线性组合的问题,而这些

新的指标Fl,F2,…,Fk(kWp),按照保留主要信息量的原则充分

反映原指标的信息,并且相互独立

(2)第一步:由X的协方差阵2x,求出其特征根,即解方程性-〃卜0

可得特征根^^-^0

第二步:求出分别所对应的特征向量UI,U2,…,Up,□=(%,.,g…,U.J

第三步:计算累积贡献率,给出恰当的主成分个数。£=U;X,i=…,k(kp)

第四步:写出各主成分,计算所选出的k个主成分的得分。对各主成

文档评论(0)

liwenfang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档