厦门大学《应用多元统计分析》第08章_相应分析.ppt

厦门大学《应用多元统计分析》第08章_相应分析.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一节 引 言 相应分析(correspondence analysis)也叫对应分析,其特点是它所研究的变量可以是定性的。通常意义下的相应分析,是指对两个定性变量(因素)的多种水平进行相应性研究,因而它的应用越来越广泛,现在这种方法已经成为常用的多元分析方法之一。 在社会、经济以及其他领域中,进行数据分析时经常要处理因素与因素之间的关系,及因素内部各个水平之间的相互关系。例如,评价某一个行业所属企业的经济效益,我们不仅要研究因素A,即企业按照经济效益好坏的分类情况,以及要研究因素B,即经济效益指标之间的关系,还要研究哪些企业与哪些经济效益指标更密切一些。这就需要相应分析的方法,将经济效益指标和企业状况放在一起进行分类、作图,以便更好的描述两者之间的关系,在经济意义上做出切合实际的解释。 相应分析的思想首先由理查森(Richardson)和库德(Kuder)于1933年提出,后来法国统计学家让-保罗?贝内泽(Jean-Paul Benzécri)等人对该方法进行了详细的论述而使其得到了发展。为了把握相应分析方法的实质,本章将从列联资料入手,介绍一些基本概念和相应分析的基本理论,并让读者理解相应分析与独立性检验的关系,进一步明确对实际问题进行相应分析研究的必要性所在。 第二节 列联表 一、列联表的概念 在实际中经常要了解两组或多组因素(或变量)之间的关系。设有两组因素A和B,其中因素A包含r个水平,即A1,A2,…,Ar;因素B包含c个水平,即B1 , B2 , …,Bc 。又设有受制于这两个因素的载体(或客体)的集合总体¥。我们希望通过对总体¥关于这两组因素的有关资料(或抽样资料),来分析这两组因素的关系。 例如,要考查在某个人群中关于吸烟或不吸烟(因素A)与得肺癌或不得肺癌(因素B)两组因素之间的关系。通常的作法是,随机地从该人群中抽样,对这两种因素进行调查,设调查了k个人,得到一个二维列联表,见表8.1。 其中,kij为调查的k人中出现因素A的第i个水平和因素B的第j个水平的人数。这样,我们就得到一个两因素,即吸烟与是否得肺癌的2 ?2列联表。 二、有关记号 为了叙述方便,先引进一些基本概念和记号。 设K=(kij)r ?c为一个r ?c的列联表(表8.2),称元素kij为原始频数。将列联表K转化为频率矩阵,记为F=(fij) r ?c ,见表8.3。 第三节 相应分析的基本理论 我们知道相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特征和它们的最优联立表示。为了实现行因素A与列因素B最优联立表示,进一步剖析行因素A内部之间,列因素B内部之间,以及因素A和列因素B之间的关系,这里将介绍原始的列联资料K=(kij) r ?c变换成矩阵Z=(zij) r ?c的具体过程,这样使得zij对因素A和列因素B具有对等性,在此基础上进行相应分析。 一、原始资料的变换 二、基于矩阵的分析过程 (8.14)式表明Zuj为相对于特征值λj的关于因素A各水平构 成的协差阵∑r的特征向量。这样我们就建立了相应分析中R型因子分析和Q型因子分析的关系。也就是说,我们可以从R型因子分析出发而直接得到Q型因子分析的结果。 这里需要强调的是,由于∑r和∑c有相同的特征根,而这些特征根又表示各个公共因子所提供的方差。那么,在因素B的c维空间Rc中的第一公共因子,第二公共因子直到第m个公共因子与因素A的r维空间Rr中相对于的各个主因子在总方差中所占的百分比就完全相同。这样就可以用相同的因子轴同时描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上。一般情形,我们取两个公共因子,这样就可以在一张二维平面图上绘出两个因素各个水平的情况,即可以直观地描述两个因素A和因素B以及各个水平之间的相关关系。 第四节 相应分析中应注意的问题 我们知道相应分析是分析两组或多组变量之间关系的有效方法,在离散情况下,它是从资料出发通过建立因素间的二维或多维列联表来对数据进行分析。在此我们要问,这种分析是否有意义,或者说对于所给的数据是否值得做这种相应分析。这一节我们将介绍相应分析与独立性检验的内在关系,以此说明应用相应分析方法在解决实际问题时,避免盲目性。 第五节 实例分析与计算机实现 一、利用SPSS进行相应分析—— 实例1 数据来自SPSS软件自带数据集voter.sav,为1992年美国大选的部分数据。要求对选民的最高学历水平(degree)和所支持的总统候选人(pres92)进行相应分析。 (一)操作步骤 1. 正确打开数据集voter.sav后,由Analyze→Data Reduction→Corresponden

文档评论(0)

aena45 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档