应用多元统计分析第八章对应分析.ppt

下载文档 降价啦

25
0
约3.08千字
约 36页
2019-08-23 发布于江西
举报
版权申诉
保障服务

应用多元统计分析第八章对应分析.ppt

1、本文档共36页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第八章 ——对应分析行和列变量的相关问题在因子分析中，或者对指标（列中的变量）进行分析，或者对样品（观测值或行中的变量）进行分析。另外，在处理实际问题中，样品的个数远远大于指标个数。如有100个样品，每个样品测100个指标，要做样品的因子分析，就要计算（100×100）阶相似系数阵的特征根和特征向量，这对于计算机来说也是一想耗时费力的事情。行和列变量的相关问题然而，在很多情况下，所关心的不仅仅是行或列本身变量之间的关系，而是行变量和列变量的相互关系；这就是因子分析等方法所没有说明的了。先看一个例子。例13.1—数据文件：ChMath.sav 在研究读写汉字能力与数学的关系的研究时，人们取得了232个美国亚裔学生的数学成绩和汉字读写能力的数据。关于汉字读写能力的变量有三个水平： “纯汉字”——可以完全自由使用纯汉字读写， “半汉字”——读写中只有部分汉字（比如日文）， “纯英文”——只能够读写英文而不会汉字。而数学成绩有4个水平（A、B、C、D）。例13.1—数据文件：ChMath.sav 这项研究是为了考察汉字具有的抽象图形符号的特性能否会促进儿童空间和抽象思维能力。该数据以列联表形式展示在表中：人们可以对这个列联表进行前面所说的X2检验来考察行变量和列变量是否独立。结果在下面表（通过Analyze-Descriptive Statistics-Crosstabs）对应分析由于所有的检验都很显著，看来两个变量的确不独立。但是如何用象因子分析的载荷图那样的直观方法来展示这两个变量各个水平之间的关系呢？这就是本章要介绍的对应分析（correspondence analysis）方法。对应分析是将指标型的因子分析与样品型的因子分析结合起来进行的统计分析。对应分析它是从指标型因子分析出发，而直接获得样品因子分析的结果。概括起来，因子分析可以提供三方面的信息：指标之间的关系；样品之间的关系；指标与样品之间的关系。对应分析的基本思想由于指标型的因子分析和样品型的因子分析都是反映一个整体的不同侧面，以它们之间一定存在内在的联系。对应分析就是通过一个过渡矩阵Z将两者有机的结合起来：即：首先给出指标变量点的协差阵A=Z’Z和样品点的协差阵B=ZZ’，由于两者有相同的非零特征根，记为：如果A的特征根对应的特征向量为则B的特征根对应的特征向量就是根据这个结论，可以很方便的借助指标型因子分析而得到样品型因子分析的结论。对应分析的基本思想如果对每组变量选择前两列因子载荷，那么两组变量就可以画出两个因子载荷的散点图。由于这两个图所表示的载荷可以配对，于是就可以把这两个因子载荷的两个散点图画到同一张图中，并以此来直观地显示各行变量和各列变量之间的关系。下面通过对ChMath.sav数据的计算和结果分析来介绍对应分析。表中的术语 Singular Value－奇异值（是惯量的平方根），反映了是行与列各水平在二维图中分量的相关程度，是对行与列进行因子分析产生的新的综合变量的典型相关系数。 Inertia－惯量, 实际上就是常说的特征根，表示的是每个维度对变量各个类别之间差异的解释量。表中的术语 Chi Square－就是关于列联表行列独立性x2检验的x2统计量的值，和前面表中的相同。其后面的Sig为在行列独立的零假设下的p-值，注释表明自由度为(4-1)×(3-1)=6，Sig.值很小说明列联表的行与列之间有较强的相关性。 Proportion of Inertia－惯量比例，是各维度（公因子）分别解释总惯量的比例及累计百分比，类似于因子分析中公因子解释能力的说明。输出结果解释从该表可以看出，由于第一维的惯量比例占了总比例的93.9%，因此，其他维的重要性可以忽略（虽然画图时需要两维，但主要看第一维－横坐标）。在对应分析中，每个变量的类别差异是通过直观图上的分值距离表现出来的，但这个距离并不是我们通常所说的距离，而是经过加权的距离，在加权的过程中，以卡方值的差异表现。行变量的有关内容行变量的有关内容第一部分是关于行变量每一类别在两个维度上的分值情况，实际上就是每一类别在坐标途中的坐标， Mass为行与列的边缘概率。第二部分（Contribution of Point to Inertia of Dimention）是说明行变量各个类别对每一维度特征值的影响，数值越大的类别，说明它对类别间差异的影响越大。第三部分（Contribution of Dimention to Inertia of Point）是说明每一维度对行变量各个类别特征值的影响。对应分析的SPSS实现首先对数据进行加权 SPSS选项：Analy