- 1、本文档共88页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对应分析(九)
第十讲 对应分析 行变量和列变量的关系:对应分析 行变量和列变量的关系:对应分析 在因子分析中,或者对变量(列中的变量)进行分析,或者对样品(观测值或行中的变量)进行分析;而且常常把每一种分析结果画出载荷图来看各个变量之间的接近程度。典型相关分析也只研究列中两组变量之间的关系。然而,在很多情况下,所关心的不仅仅是行或列本身变量之间的关系,而是行变量和列变量的相互关系;这就是因子分析等方法所没有说明的了。让我们先看一个例子。 例1 在研究读写汉字能力与数学的关系的研究时,人们取得了232个美国亚裔学生的数学成绩和汉字读写能力的数据。关于汉字读写能力的变量有三个水平: “纯汉字”意味着可以完全自由使用纯汉字读写, “半汉字”意味着读写中只有部分汉字(比如日文), “纯英文”意味着只能够读写英文而不会汉字。 而数学成绩有4个水平(A、B、C、F)。这里只选取亚裔学生是为了消除文化差异所造成的影响。这项研究是为了考察汉字具有的抽象图形符号的特性能否会促进儿童空间和抽象思维能力。 SPSS软件把该数据以列联表形式展示在下表中: 行变量和列变量的关系:对应分析 行变量和列变量的关系:对应分析 人们可以对这个列联表进行前面所说的?2检验来考察行变量和列变量是否独立。结果在下面表中(通过SPSS选项Analyze-Descriptive Statistics-Crosstabs): 由于所有的检验都很显著,看来两个变量的确不独立。但是如何用像因子分析的载荷图那样的直观方法来展示这两个变量各个水平之间的关系呢?这就是本章要介绍的对应分析(correspondence analysis)方法。 对应分析方法被普遍认为是探索性数据分析的内容;因此,只要能够会用数据画出描述性的点图,并能够理解图中包含的信息即可。 如例1数据经过对应分析的计算和结果可以表示为下面的图形。 首先看例1数据的对应分析结果的一个主要SPSS展示(图1),然后再解释该图的来源和意义。 图1 对于汉字和数学能力关系(例1)的对应分析点图。 图1体现了: 运用纯汉字的点和最好的数学成绩A最接近; 而不会汉字只会英文的点与最差的数学成绩F(虽然在纵坐标稍有差距)最接近; 用部分汉字的和数学成绩B接近。 该图非常直观地展示了单独用?2检验所无法看出的关系。 第十讲 对应分析 (COrrespOndence Analysis) 第一节 问题的提出 因子分析分为R型和Q型,寻找变量的公因子就采用R型,寻找样品的公因子就 采用Q型;R型是从变量的相关系数矩阵(或协方差阵)出发,Q型是从样品的相似 矩阵出发。在因子分析中把R型和Q型互相割裂单独进行,有些问题只作R型分析, 有些只作Q型分析,即使有些问题同时作了两种分析,在解释时也无法将它们有机地 联系起来。然而变量和样品是分不开的,我们要通过样品来获得变量的观测值,反之 又要通过变量值来对样品进行刻画和解释,即变量之间的关系只有通过样品来体现, 样品的特征和相似性又必须通过变量来刻画,这说明R型分析与Q型分析是不可分割 的。 此外,一般在实际的问题中,所取的样品数目远远地大于变量的数目,这样给Q 型因子分析带来计算上的困难,譬如有150个样品,每个样品分析10个变量,如果采 用主成分法对载荷矩阵进行估计作R型因子分析时只须计算10X10阶的变量相关系数 矩阵的特征根和特征向量,而Q型因子分析则要计算150X150阶的样品相似矩阵的特 征根和特征向量,这个计算量是十分可观的。 除了上述原因,在因子分析中还存在这样的问题:为了能够将量纲不同的变量进 行比较,往往对变量进行标准化处理,然而这种标准化只能对变量进行,对样品则无 从谈标准化,所以标准化对变量和样品是非对等的,这也给R型和Q型因子分析之间 的联系带来障碍。 针对以上问题,1970年法国统计学家Beozecri(贝尔斯凯)提出了对应分析方法 (也称相应分析),它综合了R型和Q型因子分析的优点,并将它们统一起来使得由R 型的分析结果很容易得到Q型的分析结果,这就克服了Q型分析计算量大的困难;更 重要的是可以把变量和样品的载荷反映在相同的公因子轴上,这样就把变量和样品联 系起来便于解释和推断。例如在气象问题中研究各种气象因素和样品类型的关系时, 如果我们用头两个因子轴作一个坐标系,将变量和样品的载荷同时在坐标系上点图, 相邻近的样品点属于同一类型,而这一类型附近的变量点可以解释这一类样品的成因, 这对于了解气象过程是很有益的。在地质问题中也常常需要用这种方法来解释地质作 用或过程。 从以上的讨论可知,对应分析的关键所在是使R型和Q型分析中变量点和样品点 的载荷能
文档评论(0)