典型相关分析1.docxVIP

下载本文档

3
0
约7.31千字
约 8页
2022-09-24 发布于陕西
举报
版权申诉

典型相关分析1.docx

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

典型相关分析1 第15章典型相关分析典型相关分析(canonicalcorrelation)是研究两组变量之间相关关系的一种多元统计方法.它能够揭示出两组变量之间的内在联系.我们知道,在一元统计分析中,用相关系数来衡量两个随机变量之间的线性相关关系;用复相关系数研究一个随机变量和多个随机变量的线性相关关系.然而,这些统计方法在研究两组变量之间的相关关系时却无能为力.比如要研究生理指标与训练指标的关系,居民生活环境与健康状况的关系,人口统计变量(户主年龄,家庭年收入,户主受教育程度)与消费变量(每年去餐馆就餐的频率,每年出外看电影的频率)之间是否具有相关关系?阅读能力变量(阅读速度,阅读才能)与数学运算能力变量(数学运算速度,数学运算才能)是否相关?这些多变量间的相关性如何分析?典型相关分析的目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析.目前,典型相关分析已被广泛应用于心理学,市场营销等领域,如用于研究个人性格与职业兴趣的关系,市场促销活动与消费者响应之间的关系等. 15.1典型有关分析的理论与方法 15.1.1典型相关分析的基本思想典型有关分析的基本思想和主成分分析非常相近.首先在每组变量中找到变量的一个线性组合,使两组的线性组合之间具备最小的相关系数.然后挑选出相关系数仅次于第一对线性组合并且与第一对线性组合不相关的第二对线性组合,如此继续下去,直至两组变量之间的相关性被抽取完年才.被挑选出的线性组合接合称作典型变量,它们的相关系数称作典型相关系数.典型相关系数度量了这两组变量之间联系的强度.通常情况,设x (1)(1)(1)(2)(2)=(x1(1),x2,l,xp),x(2)=(x1(2),x2,l,xq)是两个相互关联的随机向量,分别在两组变量中挑选出若干存有代表性的综合变量ui,vi,使每一个综合变量就是原变量的线性组合,即为 ((1)((1)ui=a1(i)x1(1)+a2i)x2+l+api)xp((2)((2)vi=b1(i)x1(2)+b2i)x2+l+bqi)xq a(i)′x(1) b(i)′x(2) 为了保证典型变量的唯一性,我们只考量方差为1的x (i)(1)的线性函数a′x与 b(i)′x(2),谋使它们相关系数达至最小的这一组.若存有常向量a(1),b(1),在 (1)(1)(1)(2)d(a(1)′x(1))=d(b(1)′x(2))=1的条件下,则使得相关系数ρ(a′x,b′x)达到最大, (1)(2)(1)(1)(1)(2)表示a′x,b′x就是x,x的第一对典型有关变量,它们之间的相关系数就叫做典型相关系数.求出第一对典型相关变量之后,可以类似的求出各对之间互不相关的第二对典型有关变量,第三对典型有关变量,…….这些典型有关变量就充分反映了x 性相关情况.这里值得注意的是,我们可以通过检验各对典型相关变量相关系数的显著性,来反映每一对综合变量的代表性,如果某一对的相关程度不显著,那么这对变量就不具有代表性,不具有代表性的变量就可以忽略.这样就可以通过对少数典型相关变量的研究,代替原来两组变量之间的相关关系的研究,从而容易抓住问题的本质. 15.1.2典型有关变量及典型相关系数的解步骤为了节省篇幅,不加证明地给出求解典型相关变量与典型相关系数的一般步骤:1.计算原始数据的协差阵.设有两组变量,xp≤q.令代表第一组的p个变量,x 代表第二组的q个变量,不妨假设 x1(1)(1)x2m(1)(1)xxpx(p+q)×1=(2)=(2)xx1(2)x2m(2)xq ∑11(p×p)cov(x,x)=∑(q×21p) (p×q) (q×q) ∑11=cov(x(1)),∑22=cov(x(2)),∑12=cov(x(1),x(2))=∑′21 即将总的样本协差阵剖分为第一组变量的协差阵∑11,第二组变量的协差阵∑22以及两组变量之间的协差阵∑12和∑21.2.计算两个矩阵a和b: 1a=∑111∑12∑22∑211b=∑22∑21∑111∑12 其中a为p×p阶矩阵,b为q×q阶矩阵.可以证明,矩阵a和b具有相同的非零特征根,且非零特征根的个数r=rank(a)=rank(b). 3.排序矩阵a和b的非零特征根为λ1≥λ2l≥λr,a,a ,l,a(r)为a对应于 λ12,λ22,l,λr2的特征向量,b(1),b(2),l,b(r)为b对应于λ