多元统计期末考试与参考答案.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

2010-2011-01《多元统计分析》考试题

问答题(每小题5分,共15分)

多元统计分析研究的主要内容。

多元统计分析研究的主要内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、多元方差分析、直线回归与相关、多元线性回归与相关(Ⅰ)和(Ⅱ)、主成分分析与因子分析、判别分析与聚类分析、Shannon信息量及其应用。

简述研究“多元正态分布”的重要性,试给出多元正态分布的几种定义。

许多实际问题的分布常是多元正态分布或近似正态分布,或虽本身不是正态分布,但它的样本均值近似于多元正态分布。所以研究多元正态分布可以解决很多实际问题

定义1:若P元随机向量的概率密度函数为:则称遵从P元正态分布,也称X为P元正态变量。记为

|∑|为协差阵∑的行列式。

定义2:设U=(U1,U2…,Uq)’为随机向量,U1,U2…,Uq相互独立且同N(0,1)分布,设u为p维常数向量,A为p×q常数矩阵,则称X=AU+u的分布为p元正态分布,或称X为p为正态随机向量,记为

X~Np(u,AA’)

定义3:若p维随机向量X的特征函数为

φX(t)=exp[it’u-1/2t’∑t]

则称X服从p元正态分布,记为X~Np(u,∑)

定义4:若P维随机向量X的任意线性组合均服从一元正态分布,则称X为P维正态随机向量。

相关矩阵与相似系数的联系与区别。

相关矩阵也叫相似系数矩阵,是由矩阵各列间的相似系数构成的。也就是说,相关矩阵第i行第j列的元素是原矩阵第i列和第j列的相似系数。

相似系数根据物种的重量、数量等数量指标比较两个群落或取样的相似程度的变量。

由此可见,在相关矩阵中缺少不了相似系数,相似系数是相关矩阵的基础,二者区别在于一个是矩阵,一个是变量。

名词解释(每小题3分,共15分)

特征根;定性数据;复相关系数;主成分分析方法;正交变换

特征根:特征根法是解常系数线性微分方程的一种通用方法。特征根法也可用于通过数列的递推公式(即差分方程,必须为线性)求通项公式,其本质与微分方程相同。r*r-p*r-q称为二阶齐次线性差分方程:a(n+2)=pa(n+1)+qan的特征方程。

定性数据:包括分类数据和顺序数据,是一组表示事物性质、规定事物类别的文字表述型数据,不能将其量化,只能将其定性。

复相关系数:在多元回归分析中,衡量某一变量与由多个变量线形组合后,对该变量作估计的变量之间线形关系密切程度的量,或表征由多个变量作某一变量的回归时的回归方差与该变量的方差的比例。或设因变量的观测值为Yv,由公式算出的理论值为yv,则定义复相关系数为R=其中

主成分分析方法:主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。通常把转化生成的综合指标称之为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。

正交变换:欧氏空间的线性变换A叫做正交变换。或设M是对称矩阵,P是正交矩阵,N=P^tMP称为M的正交变换。

计算(共70分)

考虑有四个与某急病有关的因素与该病的患病率数据资料如下,试进行多元线性回归分析(25分)

X1

X2

X3

X4

患病率(%)y

17

25

14

26

56.9

4

56

24

38

87.4

8

42

12

27

65.4

11

32

9

48

88.5

7

52

7

34

96.2

11

58

10

24

109.2

4

67

15

6

103.3

2

34

20

46

82

1

20

18

56

98.7

25

47

6

30

115.8

2

42

24

42

82.6

12

66

12

14

120.3

10

67

9

13

108.8

7

26

6

60

78.5

1

29

15

52

74.3

12

56

9

21

102.2

4

62

37

25

78.8

解答:

数据

由上述所给数据,输入Excel文件,在SPSS中在输入Excel文件,得到下图:

用SPSS进行多元线性回归分析,操作如下:

(1)、通过单击主菜单分析-回归-线性打开设置对话框(下图),从左边变量列表中,把X1、X2、X3、X4选入自变量框中,把患病率y选入因变量框中。

(2)在方法中选择默认的进入方法,及所选的自变量全部进入回归模型,其他各选项也是采用默认设置

(3)单击确定,得到上面定义模型的输出结果。

3、结果及解释

(1)方程包含的自变量列表,同时显示进入方法。本题方程中的自变量为X1、X2、X3、X4,选择变量进入的方法为输入。

(2)模型概述列出了模型的R、R2、调整R2及估计标准误。R2值越大所放映的自变量与因变量的共变量比率越高,模型与数据的拟合程度越好。

上面所定义模型确定系

文档评论(0)

优美的文学 + 关注
实名认证
内容提供者

优美的文学优美的文学优美的文学优美的文学优美的文学

1亿VIP精品文档

相关文档