新疆财经大学多元统计分析题库及答案 .pdf

新疆财经大学多元统计分析题库及答案 .pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

新疆财经大学多元统计分析题库及答案

一.简述题(每题10分)

1.简述主成分分系方法和因子分析方法的异同?

解答:

不同之处:

主成分的概念由KarlPearson在1901年提出;因子分析由

CharlesSpearman于1904年首次提出的。

主成分分析中的主成分个数与原始变量个数是一样的.即有几个

变量就有几个主成分.只不过最后我们确定了少数几个主成分而已。

而因子分析则需要事先确定要找几个成分.也称为因子(factor).然

后将原始变量综合为少数的几个因子.以再现原始变量与因子之间的

关系.一般来说.因子的个数会远远少于原始变量的个数。

因变量和因子个数的不一致.使得不仅在数学模型上.而且在实

际求解过程中.因子分析和主成分分析都有着一定的区别.计算上因

子分析更为复杂。

在对主成分和原始变量之间的关系进行描述时.如果主成分的直

观意义比较模糊不易解释.主成分分析没有更好的改进方法;因子分

析则额外提供了“因子旋转(factorrotation)”这样一个步骤.可以

使分析结果尽可能达到易于解释且更为合理的目的。

相似之处:

考察多个变量间相关性一种多元统计方法。

研究如何通过少数几个主成分(principalcomponent)来解释多

个变量间的内部结构。

因子分析可以看作是主成分分析的推广和扩展.但它对问题的研

究更深入、更细致一些。实际上.主成分分析可以看作是因子分析的

一个特例。

2.简述K-means聚类分析的基本步骤?

解答:

第1步:确定要分的类别数目K

需要研究者自己确定在实际应用中.往往需要研究者根据实际问

题反复尝试.得到不同的分类并进行比较.得出最后要分的类别数

量。

第2步:确定K个类别的初始聚类中心

要求在用于聚类的全部样本中.选择K个样本作为K个类别的初

始聚类中心与确定类别数目一样.原始聚类中心的确定也需要研究者

根据实际问题和经验来综合考虑.使用SPSS进行聚类时.也可以由系

统自动指定初始聚类中心。

第3步:根据确定的K个初始聚类中心.依次计算每个样本到K

个聚类中心的距离欧氏距离.并根据距离最近的原则将所有的样本分

到事先确定的K个类别中

第4步:根据所分成的K个类别.计算出各类别中每个变量的均

值.并以均值点作为新的K个类别中心。根据新的中心位置.重新计

算每个样本到新中心的距离.并重新进行分类。

第5步:重复第4步.直到满足终止聚类条件为止

迭代次数达到研究者事先指定的最大迭代次数(SPSS隐含的迭

代次数是10次)新确定的聚类中心点与上一次迭代形成的中心点的

最大偏移量小于指定的量(SPSS隐含的是0.02)。

K-均值聚类法是根据事先确定的K个类别反复迭代直到把每个

样本分到指定的里类别中。类别数目的确定具有一定的主主观性.究

竟分多少类合适.需要研究者对研究问题的了解程度、相关知识和经

3.简述判别分析和聚类分析的不同之处?

解答:

1.定义的不同:统计分类中.有的事先并不知道存在什么类别.

完全按照反映对象特征的数据把对象进行分类.这在统计上称为聚类

分析;有的则是在事先有了某种分类标准之后.判定一个新的研究对

象应该归属到哪一类别.这在统计上则称为判别分析

(discriminantanalysis)

2.实际操作的不同:和聚类分析的不同之处在于判别分析知道

训练样本的类别.属于监督学习.而聚类则不知道任何样本类别.属于

非监督学习。

4.简述多重共线性问题的识别方法?解答:

检测多重共线性的最简单的一种办法是计算模型中各对自变量

之间的相关系数.并对各相关系数进行显著性检验.若有一个或多个

相关系数显著.就表示模型中所用的自变量之间相关.存在着多重共

线性

考察各回归系数的显著性.当模型的线性关系检验(F检验)显著

时.几乎所有回归系数的t检验却不显著.表明存在共性性

分析回归系数的正负号.回归系数的正负号与预期的相反

容忍度(tolerance)与方差扩大因子

(varianceinflationfactor.VIF)。

某个自变量的容忍度等于1减去该自变量为因变量

文档评论(0)

. + 关注
官方认证
内容提供者

专注于职业教育考试,学历提升。

版权声明书
用户编号:8032132030000054
认证主体社旗县清显文具店
IP属地河南
统一社会信用代码/组织机构代码
92411327MA45REK87Q

1亿VIP精品文档

相关文档