第七讲典型相关分析.pptVIP

  • 0
  • 0
  • 约4.74千字
  • 约 45页
  • 2025-08-19 发布于广东
  • 举报

相关分析的冗余分析通过不同观察变量组的代表比例和解释比例相乘,可以得到因变量组总方差与协变量组总方差的共享比例。即:因变量组的VarDE×协变量组的VarDE或:因变量组的VarCO×协变量组的VarCO两个变量组的共享方差第30页,共45页,星期日,2025年,2月5日相关分析的冗余分析第一典型相关的共享方差为:0.41078×0.72349=0.29720=29.720%第二典型相关的共享方差为:0.43353×0.24575=0.10354=10.654%第三典型相关的共享方差为:0.04384×0.03076=0.00135=0.135%第31页,共45页,星期日,2025年,2月5日例12.2(科技经费投入.sav)我国科技市场产出情况与RD经费支出变量的典型相关分析“科学技术是第一生产力”,近几年来,我国在科研方面的投入不断增加,国家的研究与试验发展(RD)经费内部支出到2001年已达到8956.6亿元。那么,科技市场的产出情况是否与经费投入密切相关?各种类型的经费投入对科技市场的发展具体有怎样的影响?通过对RD各种项目的支出变量与科技市场在某些方面的产出变量做典型相关分析,找出两者之间的联系。第32页,共45页,星期日,2025年,2月5日第1页,共45页,星期日,2025年,2月5日第七讲典型相关分析第2页,共45页,星期日,2025年,2月5日两组变量的相关问题我们知道如何衡量两个变量之间是否相关的问题;这是一个简单的公式就可以解决的问题(Pearson相关系数、Kendall’st、Spearman秩相关系数)。如果我们有两组变量,如何表明它们之间的关系呢?第3页,共45页,星期日,2025年,2月5日例.1(数据tv.sav)例如:业内人士和观众对于一些电视节目的观点有什么样的关系呢?数据tv.sav是不同的人群对30个电视节目所作的平均评分。观众评分来自低学历(led)、高学历(hed)和网络(net)调查三种,它们形成第一组变量;而业内人士分评分来自包括演员和导演在内的艺术家(arti)、发行(com)与业内各部门主管(man)三种,形成第二组变量。人们对这样两组变量之间的关系感到兴趣。第4页,共45页,星期日,2025年,2月5日第5页,共45页,星期日,2025年,2月5日第一组变量:观众第二组变量:业内人士低学历高学历网络主管发行人艺术家典型相关第6页,共45页,星期日,2025年,2月5日如何进行典型相关如果直接对这六个变量的相关进行两两分析,很难得到关于这两组变量之间关系的一个清楚的印象。希望能够把多个变量与多个变量之间的相关化为两个变量之间的相关。现在的问题是为每一组变量选取一个综合变量作为代表;而一组变量最简单的综合形式就是该组变量的线性组合。第7页,共45页,星期日,2025年,2月5日如何进行典型相关由于一组变量可以有无数种线性组合(线性组合由相应的系数确定),因此必须找到既有意义又可以确定的线性组合。典型相关分析(canonicalcorrelationanalysis)就是要找到这两组变量线性组合的系数,使得这两个由线性组合生成的变量(和其他线性组合相比)之间的相关系数最大。第8页,共45页,星期日,2025年,2月5日XV1V2|VdYW1W2|Wdx1x2xiy1y2yjcr1cr2crdd=min(i,j)(V=a0+a1x1+…+aixi)(W=b0+b1y1+…+bjyj)第9页,共45页,星期日,2025年,2月5日建立第一对典型变量(函数)的原则尽量使所建的两个典型变量之间的相关系数最大化,就是在两个变量组各自的总变化中先寻求他们之间最大的一部分共变关系,并用一对典型变量所描述。因而,第一维度上的典型相关系数也随之求的。第10页,共45页,星期日,2025年,2月5日建立第二对典型变量(函数)的原则继续在两组变量剩余的变化中寻找第二个最大的共变部分,形成第二对典型变量,并解出第二维度上的典型相关系数。依此类推,直至所有变化部分被剥离完毕。第11页,共45页,星期日,2025年,2月5日典型相关系数这里所涉及的主要的数学工具还是矩阵的特征值和特征向量问题。而所得的特征值与V和W的典型相关系数有直接联系。由于特征值问题的特点,实际上找到的是多组典型变量(V1,W1),(V2,W2),…,其中V1和W1最相关,而V2和W2次之等等,而且V1,V2,V3,…之间及而且W1,W2,W3

文档评论(0)

1亿VIP精品文档

相关文档