- 1、本文档共90页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ch7SAS典型相关与对应分析 91
第七章 典型相关与对应分析 7.1 典型相关分析 7.2 对应分析 7.1 典型相关分析 7.1.1 典型相关分析的概念与步骤 7.1.2 用INSIGHT模块实现典型相关分析 7.1.3 用“分析家”实现典型相关分析 7.1.4 用CANCORR过程实现典型相关分析 7.1.1 典型相关分析的概念与步骤 1. 典型相关分析的基本思想 典型相关分析采用主成分的思想浓缩信息,根据变量间的相关关系,寻找少数几对综合变量(实际观测变量的线性组合),用它们替代原始观测变量,从而将二组变量的关系集中到少数几对综合变量的关系上,通过对这些综合变量之间相关性的分析,回答两组原始变量间相关性的问题。除了要求所提取的综合变量所含的信息量尽可能大以外,提取时还要求第一对综合变量间的相关性最大,第二对次之,依次类推。 这些综合变量被称为典型变量,或典则变量,第1对典型变量间的相关系数则被称为第1典型相关系数。典型相关系数能简单、完整地描述两组变量间关系的指标。当两个变量组均只有一个变量时,典型相关系数即为简单相关系数;当其中的一组只有一个变量时,典型相关系数即为复相关系数。 2. 典型相关系数与典型相关变量 设X = (X1,X2,…,Xp),Y = (Y1,Y2,…,Yq)是两个随机向量。利用主成分思想寻找第i对典型相关变量(Ui,Vi): Ui = ai1X1 + ai2X2 + … + aipXp = aiX Vi = bi1Y1 + bi2Y2 + … + biqYq = biY i = 1,2,…,m = min(p,q);称ai和bi为(第i对)典型变量系数或典型权重。 记第一对典型相关变量间的典型相关系数为: CanR1 = Corr(U1,V1)(使U1与V1间最大相关); 第二对典型相关变量间的典型相关系数为: CanR2 = Corr(U2,V2)(与U1、V1无关;使U2与V2间最大相关)… 第m对典型相关变量间的典型相关系数为: CanRm = Corr(Um,Vm)(与U1,V1,…,Um–1,Vm–1无关;Um与Vm间最大相关) 3. 典型相关变量的性质 各对典型相关变量所包括的相关信息互不交叉,且满足: 1) U1,U2,…,Um互不相关,V1,V2,…,Vm互不相关,即其相关系数为 2) 同一对典型相关变量Ui和Vi之间的相关系数为CanRi,不同对的典型相关变量之间互不相关,即: 3) Ui和Vi的均值为0,方差为1(i = 1,…,m)。 4) 1 ≥ CanR1 ≥ CanR2 ≥ … ≥ CanRm ≥ 0 4. 典型相关系数的求解步骤 1) 求X,Y变量组的相关阵 R = ; 2) 求矩阵 A = (R11)–1R12(R22)–1R21 和 B = (R22)–1R21(R11)–1R12, 可以证明A、B有相同的非零特征值; 3) 求A或B的特征值λi与CanRi,A或B的特征值即为典型相关系数的平方:λi = (CanRi)2,i = 1,…,m。 4) 求A、B关于λi的特征向量。设ai为A关于λi的特征向量,bi为B关于λi的特征向量,则ai和bi为(第i对)典型变量系数。即第i对典型相关变量(Ui,Vi): Ui = aiX* = ai1X1* + ai2X2* + … + aipXp* Vi = biY* = bi1Y1* + bi2Y2* + … + biqYq* i = 1,2,…,m = min(p,q);其中X*,Y*为原变量组的标准化。 5. 特征根 特征根(eigenvalue)是方差分析和多元检验的基础,特征根与典型相关系数之间的数量关系为: 上式可以理解为第i对典型变量表示观测变量总方差作用的指标,它的值越大说明表示作用越大。 6. 典型相关系数的标准误 7. 典型相关系数的假设检验 典型相关系数的假设检验包括对全部总体典型相关系数的检验和对部分总体典型相关系数的检验。对数据的要求: 1) 两个变量组均应服从多维正态分布: (X,Y)~Np+q(μ,σ2) 2) n p + q (1) 全部总体典型相关系数为0 H0:CanRi = 0,i = 1,…,m H1:至少有一个CanRi ≠ 0 检验的似然比统计量为 对于充分大的n,当H0成立时,统计量 近似服从自由度为pq的?2分布。 (2) 部分总体典型相关系数为0 仅对较小的典型相关作检验:
文档评论(0)