- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章 典型相关分析
§8.1 典型相关分析及基本思想
一、定义
在一元统计分析中,研究两个随机变量之间的线性相关关系,可用相关系数(称为简单相关系数);研究一个随机变量与多个随机变量之间的线性相关关系,可用复相关系数(称为全相关系数)。1936年荷泰林(Hotelling)在《生物统计》发表一篇论文《两组变式之间的关系》首先将它推广到研究多个随机变量与多个随机变量之间的相关关系的讨论中,提出了典型相关分析。
二、应用
实际问题中,两组变量之间具有相关关系的问题很多,例如:
①几种主要产品如猪肉、牛肉、鸡蛋的价格(作为第一组变量)和相应这些产品的销售量(作为第二组变量)有相关关系;
②投资性变量(如劳动者人数、货物周转量、生产建设投资等)与国民收入变量(如工农业国民收入、运输业国民收入、建筑业国民收入等)具有相关关系;
③患某种疾病的病人的各种症状程度(第一组变量)和用物理化学方法检验的结果(第二组变量)具有相关关系;
④运动员体力测试指标(如反复横向跳、纵跳、背力、握力等)与运动能力测试指标(如耐力跑、跳远、投球等)之间具有相关关系等。
⑤个人表现与家庭的社会经济状况的关系;
⑥典型相关分析还可以应用于对应关系的研究,如夫妻之间、代际之间、干群之间、供求之间所存在的两组多变量之间关系的研究。
三、基本思想
首先在每组变量中找出变量的线性组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与第一对线性组合不相关,而第二对本身具有最大的相关性,如此继续下去,直到两组变量之间的相关性被提取完毕为止。有了这样线性组合的最大相关,则讨论两组变量之间的相关,就转化为只研究这些线性组合的最大相关,从而减少研究变量的个数。
典型相关分析就是研究两组变量之间相关关系的一种多元统计方法,设两组变量用,,…,及,…,表示。要研究两组变量的相关关系,一种方法是分别研究与(;)之间的相关关系,然后列出相关系数表进行分析,当两组变量较多时,这样做法不仅烦琐,也不易抓住问题的实际;另一种方法采用类似主成分分析的做法,在每一组变量中都选择若干个有代表性的综合指标(变量的线性组合),通过研究两组的综合指标之间的关系来反映两组变量之间的相关关系。
例如,,,,表示一组变量;,,表示另一组变量。研究它们之间的相关关系,就是希望构造一个,,,的线性函数及,,的线性函数:
。
该式称为典型变式,aij称为典型系数。
要求它们之间具有最大相关性。如图8-1所示。
Y
Y
Cv1-1
Cv1-2
Cv1-3
X1
X2
X3
X4
X
Cv2-1
Cv2-1
Cv2-3
。。。。
Y1
Y1
Y1
Cr1
Cr2
Cr3
图8-1 典型相关分析示意图
称自
变量X为预测变量(predictor variables)。
称因变量Y为标准变量(criterion variable)。
在有隐含的或明确的因果联系假设时,主要研究一个方向的作用。在完全没有内在的因果关系时,就需要进行双向的分析。当然,只要组内变量不变,结果是一样的。
§8.2 典型相关分析的数学描述
设有两组随机变量
,
记,不妨设,
假定的协方差阵 ,均值向量(否则只要以代替即可),相应的将剖分为
其中,是第一组变量的协方差阵,
是第一组与第二组变量的协方差阵,
是第二组变量的协方差阵。
要研究两组变量之间的相关关系,前面已介绍两组变量的线性组合,即
其中:
,为任意非零常数向量,易见:
我们希望寻求和使达到最大,但由于随机变量乘以常数时不改变它们的相关系数,为防止不必要的结果重复出现,最好的限制是令Var,Var。于是我们的问题就成为在约束条件:
Var,Var,寻求和使
达到最大。
§8.3 总体的典型相关系数和典型变量
一、总体的典型相关系数和典型变量的求法
在约束条件:
①
时寻求和使达到最大值,
根据数学分析中条件极值的求法引入Lagrange乘数,可将问题转化为求
②
的极大值,其中,是Lagrange乘数。
由极值的必要条件为
③
将上二式分别左乘与,则得
而=,所以,这就是说恰好是线性组合和之间的相关系数。于是解方程组③归结为解方程组:
④
为了具体求解,以左乘④中第二式并将第一式代入得
⑤
用左乘④式第一式并将第二式代入得
⑥
用左乘⑤式得
⑦
用左乘⑥式得
⑧
记
则得
说明既是又是的特征根,、就是其相应于和的特征向量。
和的特征根有如下性质
您可能关注的文档
最近下载
- 《中国互联网发展史》课件.ppt VIP
- 马克思主义政治经济学概论(第二版)第十章.ppt VIP
- 149页-【低空经济】大型露天矿区安全生产无人机巡查与管理系统设计.pdf
- 《朝花夕拾》经典青少年文学读物.pdf VIP
- 学校食堂卫生标准的食品烹饪温度与时长要求.docx VIP
- 2025凉山州专业技术人员继续教育公需科目全套十一讲满分答案(纯).docx
- 新出_魏哲墓志铭_及其相关问题_张存良.pdf VIP
- 课题申报参考:人工智能赋能中国传统陶瓷文化基因图谱构建及创新设计研究.docx VIP
- 【新版】人教部编版一年级语文上册《和大人一起读剪窗花》优质课件.pptx VIP
- 2025质量管理 GBT 19001-2016的统计技术指南.docx VIP
文档评论(0)