第20章++典型相关分析.pptVIP

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第20章 典型相关分析 学习目标 了解典型相关分析的数学表达方式,假定条件; 熟悉典型相关系数的数学含义; 掌握典型变量系数的数学含义; 掌握简单相关,复相关和典型相关的意义; 掌握典型相关分析的SAS过程步:CANCORR过程步。 概述 对于两个变量,是用它们的相关系数来衡量它们之间的线性相关关系的。当考虑一个变量与一组变量的线性相关关系时,是用它们的多重相关系数来衡量。但是,许多医学实际问题中,常常会碰到两组变量之间的线性相关性研究问题。例如,教育研究者想了解3个学术能力指标与5个在校成绩表现之间的相关性;对于这类问题的研究引进了典型相关系数的概念,从而找到了揭示两组变量之间线性相关关系的一种统计分析方法——典型相关分析。 典型相关 典型关系分析是分析两组变量之间相关性的一种统计分析方法,它包含了简单的Pearson相关分析(两个组均含一个变量)和复相关分析(一个组含有一个变量,而另一组含有多个变量)这两种特殊情况。典型相关分析的基本思想和主成分分析的基本思想相似,它将一组变量与另一组变量之间单变量的多重线性相关性研究转化为对少数几对综合变量之间的简单线性相关性的研究,并且这少数几对变量所包含的线性相关性的信息几乎覆盖了原变量组所包含的全部相应信息。 典型相关 典型相关分析方法的基本原理是:所有研究的两组变量为x组和y组,x 组有p个变量 , y 组有q个变量 ,则分别对这两组变量各做线性组合后,再计算此两加权和的简单相关系数,然后以这个简单相关系数当做这两组变数之间相关性的衡量指标。即 典型相关 对于任意一组系数 和 都可以通过上式求出一对典型变量,典型相关分析中称之为典型变量。进而可以求出典型变量的简单相关系数,称之为典型相关系数。 x 组的p个变量组合成一个,y组的q个变量也组合成一个,然后计算简单相关来衡量两组之间的相关性。问题是如何组合? 典型相关 设两组变量分别为x组有p个变量 ,而y组有q个变量 ,我们先分别把x组和y组的变量组合起来(当然是用线性组合),也就是 其中这些系数都是一些常数,就是组合的比例,由于是线性组合,所以 且 。 典型相关 有两个问题需要解决: 给定不同组合比例 以及 ,都可以算出不一样的简单相关系数,这使得这个方法非常的不科学,每个人都可以依照自己的喜好来决定组合比例,并且在衡量两组变量之间相关性的问题上,也没有一个统一的标准。 各组内变量之间的尺度不太相同,例如身高的尺度跟脚掌长度的尺度就不相同,显然前者的变异数会大于后者,这种情况是不合理的。 典型相关 针对第一个问题,“在所有的组合中,寻找一个组合使得简单相关系数为最大”,可能是个好想法;另外,寻找一个组合使得简单相关系数为最小,此简单相关系数就是典型相关系数,而典型相关系数的平方称为典型根。 典型相关 对于第二个问题,解决的方法就是对资料进行标准化。 典型相关分析的第一步是估计组合系数,使得对应的典型变量和的相关系数达到最大。这个最大的相关系数是第一典型相关系数,且称具有最大相关系数的这对典型变量为第一典型变量。 典型相关 典型相关分析的第二步是再次估计组合系数,使得对应的典型变量相关系数达到第二大,且第二对典型变量中的第一次变量与第一对典型变量中的每一个变量不相关。这个最二大的相关系数是第二典型相关系数,且称具有最二大相关系数的这对典型变量和为第二典型变量。 如果两个组中变量的个数为p,q,pq,那么寻求典型变量的过程可以一直连续进行下去,直到得到p对典型变量为止。 典型相关 从上述分析的过程可以看出,第一对典型变量的第一典型相关系数描述了两个组中变量之间的相关程度,且它提取的有关这两组变量相关性的信息量最多。第二对典型变量的第二典型相关系数也描述了两个组中变量之间的相关程度,但它提取的有关这两组变量相关性的信息量次多。以此类推, 典型相关 可以得知,由上述方法得到的一系列典型变量的典型相关系数所包含的有关原变量组之间相关程度的信息一个比一个少。如果少数几对典型变量就能够解释原数据的主要信息,特别是如果一对典型变量就能够反映出原数据的主要信息,那么,对两个变量组之间相关程度的分析就可以转化为对少数几对或者是一对典型变量的简单相关分析。这就是典型相关分析的主要目的。 典型相关分析的理论架构 设两组变量分别为x组有p个变量 ,而y组有q个变量 ,

文档评论(0)

xiaohuer + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档