应用多元统计分析-第九章 典型相关分析.pptxVIP

应用多元统计分析-第九章 典型相关分析.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
典型相关分析第九章典型相关分析两组变量的相关问题我们知道如何衡量两个变量之间是否相关的问题;这是一个简单的公式就可以解决的问题(Pearson相关系数、 Kendall’s t、 Spearman 秩相关系数)。如果我们有两组变量,如何表明它们之间的关系呢?例9.1(数据tv.sav)例如:业内人士和观众对于一些电视节目的观点有什么样的关系呢?数据tv.sav是不同的人群对30个电视节目所作的平均评分。观众评分来自低学历(led)、高学历(hed)和网络(net)调查三种,它们形成第一组变量;而业内人士分评分来自包括演员和导演在内的艺术家(arti)、发行(com)与业内各部门主管(man)三种,形成第二组变量。人们对这样两组变量之间的关系感到兴趣。低学历艺术家第一组变量:观众第二组变量:业内人士典型相关高学历发行人网络主管如何进行典型相关如果直接对这六个变量的相关进行两两分析,很难得到关于这两组变量之间关系的一个清楚的印象。希望能够把多个变量与多个变量之间的相关化为两个变量之间的相关。现在的问题是为每一组变量选取一个综合变量作为代表;而一组变量最简单的综合形式就是该组变量的线性组合。如何进行典型相关由于一组变量可以有无数种线性组合(线性组合由相应的系数确定),因此必须找到既有意义又可以确定的线性组合。典型相关分析(canonical correlation analysis)就是要找到这两组变量线性组合的系数,使得这两个由线性组合生成的变量(和其他线性组合相比)之间的相关系数最大。 x1y1XV1V2|VdYW1W2|Wdcr1x2y2cr2crdd=min(i, j)xiyj(V1=a0+a1x1+…+aixi)(W1=b0+b1y1+…+bjyj)建立第一对典型变量(函数)的原则尽量使所建的两个典型变量之间的相关系数最大化,就是在两个变量组各自的总变化中先寻求他们之间最大的一部分共变关系,并用一对典型变量所描述。因而,第一维度上的典型相关系数也随之求的。建立第二对典型变量(函数)的原则继续在两组变量剩余的变化中寻找第二个最大的共变部分,形成第二对典型变量,并解出第二维度上的典型相关系数。依此类推,直至所有变化部分被剥离完毕。典型相关分析原理及方法设有两组随机向量,典型相关分析原理及方法典型相关分析原理及方法根据典型相关分析的基本思想,要进行两组随机向量间的相关分析,首先要计算出各组变量的线性组合——典型变量,并使其相关系数达到最大。因此,我们设两组变量的线性组合分别为:典型相关分析原理及方法显见:典型相关分析原理及方法我们希望寻找使相关系数达到最大的向量a与b,由于随机向量乘以常数时并不改变他们的相关系数,所以,为防止结果的重复出现,令:那么:这样就成为求使上式达到最大的系数向量a与b。典型相关系数这里所涉及的主要的数学工具还是矩阵的特征值和特征向量问题。而所得的特征值与V和W的典型相关系数有直接联系。由于特征值问题的特点,实际上找到的是多组典型变量(V1, W1), (V2, W2),…,其中V1和W1最相关,而V2和W2次之等等,而且V1, V2, V3,…之间及而且W1, W2, W3,…之间互不相关。这样又出现了选择多少组典型变量(V, W)的问题了。实际上,只要选择特征值累积总贡献占主要部分的那些即可。注意严格地说,一个典型相关系数描述的只是一对典型变量之间的相关,而不是两个变量组之间的相关。而各对典型变量之间构成的多维典型相关才共同揭示了两个观测变量组之间的相关形式。典型相关模型的基本假设和数据要求要求两组变量之间为线性关系,即每对典型变量之间为线性关系;每个典型变量与本组所有观测变量的关系也是线性关系。如果不是线性关系,可先线性化:如经济水平和收入水平与其他一些社会发展水之间并不是线性关系,可先取对数。即log经济水平,log收入水平。典型相关模型的基本假设和数据要求所有观测变量为定量数据。同时也可将定性数据按照一定形式设为虚拟变量后,再放入典型相关模型中进行分析。检验假设:典型相关分析说明下面就tv.sav数据进行典型相关分析的说明头两对典型变量(V, W)的累积特征根已经占了总量的99.427%。它们的典型相关系数也都在0.95之上。 典型相关系数的平方与简单相关系数一样,典型相关系数的实际意义并不十分明确。所以,由经验的研究人员往往更愿意采用典型相关系数的平方(相当于回归分析中的确定系数)。由于相关涉及的两个典型变量都是标准化的,所以双方的方差都等于1 。典型相关系数的平方的实际意义是一对典型变量之间的共享方差在两个典型变量各自方差中的比例。典型相关系数的检验整体检验:典型相关系数的检验维度递减检验:仍然是一种多元检验,但可以提供每对典型变量的典型相关是否显著的信息。Dimension Reduct

文档评论(0)

wpxuang12 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档