《典型相关》课件.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

CanonicalCorrelationAnalysis典型相关分析

典型相关分析是研究两组变量之间相关关系的一种统计方法。1在科学研究中常需要分析一组个指标与另一组个指标的相关关系,简单的方法两两指标间分别统计简单相关关系,得到个相关系数,用这些相关系数反映两组变量间的关系。但这样做即繁琐又抓不住要领。更有效的方法是类似主成分分析,考虑每组变量的线性组合,从这两族线性组合中找出最相关的组合变量,通过少数几个综合变量来反映两组变量间的相关关系,这样就可以抓住它们的主要关系,而且简明。这就是典型相关分析的基本思想。2引言

何时采用典型相关分析两个随机变量Y与X简单相关系数一个随机变量Y与一组随机变量X1,X2,…,Xp多重相关(复相关系数)一组随机变量Y1,Y2,…,Yq与另一组随机变量X1,X2,…,Xp典型(则)相关系数

典型相关分析示意图X1Y1Y2Y3Y4Y5X2X3X4X5X6XYU1U2U3U4U5V1V2V3V4V5CanR1CanR2CanR3CanR4CanR5

典型相关和典型相关变量的定义

典型相关变量的一般求法

第一对典型相关变量的求法

典型相关变量的性质

业内人士和观众对于一些电视节目的观点有什么样的关系呢?该数据是不同的人群对30个电视节目所作的平均评分。观众评分来自低学历(led)、高学历(hed)和网络(net)调查三种,它们形成第一组变量;而业内人士分评分来自包括演员和导演在内的艺术家(arti)、发行(com)与业内各部门主管(man)三种,形成第二组变量。人们对这样两组变量之间的关系感到兴趣。例子(数据tv.txt)

计算结果下面一个表给出了特征根(Eigenvalue),特征根所占的百分比(Pct)和累积百分比(Cum.Pct)和典型相关系数(CanonCor)及其平方(Sq.Cor)。看来,头两对典型变量(V,W)的累积特征根已经占了总量的99.427%。它们的典型相关系数也都在0.95之上。

计算结果对于众多的计算机输出挑出一些来介绍。下面表格给出的是第一组变量相应于上面三个特征根的三个典型变量V1、V2和V3的系数,即典型系数(canonicalcoefficient)。这些系数以两种方式给出;一种是没有标准化的原始变量的线性组合的典型系数(rawcanonicalcoefficient),一种是标准化之后的典型系数(standardizedcanonicalcoefficient)。标准化的典型系数直观上对典型变量的构成给人以更加清楚的印象。

可以看出,头一个典型变量V1相应于前面第一个(也是最重要的)特征值,主要代表高学历变量hed;而相应于前面第二个(次要的)特征值的第二个典型变量V2主要代表低学历变量led和部分的网民变量net,但高学历变量在这里起负面作用。

计算结果类似地,也可以得到被称为协变量(covariate)的标准化的第二组变量的相应于头三个特征值得三个典型变量W1、W2和W2的系数:。

从这两个表中可以看出,V1主要和变量hed相关,而V2主要和led及net相关;W1主要和变量arti及man相关,而W2主要和com相关;这和它们的典型系数是一致的。由于V1和W1最相关,这说明V1所代表的高学历观众和W1所主要代表的艺术家(arti)及各部门经理(man)观点相关;而由于V2和W2也相关,这说明V2所代表的低学历(led)及以年轻人为主的网民(net)观众和W2所主要代表的看重经济效益的发行人(com)观点相关,但远远不如V1和W1的相关那么显著(根据特征值的贡献率)。例子结论

(二)典型相关系数计算实例求X,Y变量组的相关阵R=

1985年中国28省市城市男生(19~22岁)的调查数据。记形态指标身高(cm)、坐高、体重(kg)、胸围、肩宽、盆骨宽分别为X1,X2,…,X6;机能指标脉搏(次/分)、收缩压(mmHg)、舒张压(变音)、 舒张压(消音)、肺活量(ml)分别为Y1,Y2,…,Y5。现欲研究这两组变量之间的相关性。

简单相关系数矩阵

Corr(X)=R11Corr(Y,X)=R21Corr(Y)=R22Corr(X,Y)=R12

简单相关系数公式符号Corr(X)=R11Corr(Y)=R22Corr(Y,X)=R21Corr(X,Y)=R12

(一)求解典型相关系数的步骤求X,Y变量组的相关阵R=求矩阵A、B可以证明A、B有相同的非零特征根求A或B的λi(相关平方)与CanRi,i=1,…,m求A、B关于λi的特征根向量即变量系数0103020405

2.求矩阵A、B

A矩阵(p×p)0.52980.45860.

文档评论(0)

wangwumei1975 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档