- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
典型相关分析1
典型相关分析1
第 15 章 典型相关分析
典型相关分析(Canonical Correlation)是研究两组变量之间相关关系的一种多元统计方 法.它能够揭示出两组变量之间的内在联系. 我们知道,在一元统计分析中,用相关系数来衡量两个随机变量之间的线性相关关系; 用复相关系数研究一个随机变量和多个随机变量的线性相关关系. 然而, 这些统计方法在研 究两组变量之间的相关关系时却无能为力. 比如要研究生理指标与训练指标的关系, 居民生 活环境与健康状况的关系,人口统计变量(户主年龄,家庭年收入,户主受教育程度)与消 费变量(每年去餐馆就餐的频率,每年出外看电影的频率)之间是否具有相关关系?阅读能 力变量(阅读速度,阅读才能)与数学运算能力变量(数学运算速度,数学运算才能)是否 相关?这些多变量间的相关性如何分析? 典型相关分析的目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析, 转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析. 目前,典型相关分析已被广泛应用于心理学,市场营销等领域,如用于研究个人性格与 职业兴趣的关系,市场促销活动与消费者响应之间的关系等.
15.1 典型相关分析的理论与方法
15.1.1 典型相关分析的基本思想
典型相关分析的基本思想和主成分分析非常相似. 首先在每组变量中找出变量的一个线 性组合, 使得两组的线性组合之间具有最大的相关系数. 然后选取相关系数仅次于第一对线 性组合并且与第一对线性组合不相关的第二对线性组合, 如此继续下去, 直到两组变量之间 的相关性被提取完毕为止. 被选出的线性组合配对称为典型变量, 它们的相关系数称为典型 相关系数.典型相关系数度量了这两组变量之间联系的强度. 一般情况,设 X
(1) (1) (1) (2) (2) = ( X 1(1) , X 2 ,L , X p ) , X (2) = ( X 1(2) , X 2 ,L , X q ) 是两个相互关
联的随机向量,分别在两组变量中选取若干有代表性的综合变量 U i , Vi ,使得每一个综合 变量是原变量的线性组合,即
( (1) ( (1) U i = a1(i ) X 1(1) + a2i ) X 2 + L + aPi ) X P ( (2) ( (2) Vi = b1(i ) X 1(2) + b2i ) X 2 + L + bqi ) X q
a (i )′ X (1)
b (i )′ X (2)
为了确保典型变量的唯一性, 我们只考虑方差为 1 的 X
(i ) (1) 的线性函数 a ′ X 与
b( i )′ X (2) , 求 使 得 它 们 相 关 系 数 达 到 最 大 的 这 一 组 . 若 存 在 常 向 量 a (1) , b(1) , 在
(1) (1) (1) (2) D (a (1)′ X (1) ) = D(b(1)′ X (2) ) = 1 的条件下, 则 使得相关系数 ρ ( a ′ X , b ′ X ) 达到最大,
(1) (2) (1) (1) (1) (2) 称 a ′ X ,b ′ X 是 X , X 的第一对典型相关变量,它们之间的相关系数就叫典型
相关系数. 求出第一对典型相关变量之后, 可以类似的求出各对之间互不相关的
第二对典型 相关变量,第三对典型相关变量,…….这些典型相关变量就反映了 X
性相关情况.这里值得注意的是,我们可以通过检验各对典型相关变量相关系数的显著性, 来反映每一对综合变量的代表性, 如果某一对的相关程度不显著, 那么这对变量就不具有代 表性,不具有代表性的变量就可以忽略.这样就可以通过对少数典型相关变量的研究,代替 原来两组变量之间的相关关系的研究,从而容易抓住问题的本质.
15.1.2 典型相关变量及典型相关系数的求解步骤
为了节省篇幅,不加证明地给出求解典型相关变量与典型相关系数的一般步骤: 1. 计算原始数据的协差阵. 设有两组变量, X p≤q.令
代表第一组的 p 个变量, X
代表第二组的 q 个变量,不妨假设
X 1(1) (1) X2 M (1) (1) X Xp X ( p + q )×1 = (2) = (2) X X1 (2) X2 M (2) Xq
∑ 11 ( p× p ) Cov( X , X ) = ∑ ( q×21 p)
( p× q )
( q× q )
∑11 = Cov( X (1) ) , ∑ 22 = Cov( X (2) ) ,
文档评论(0)