第十讲典型相关分析演示文稿.pptVIP

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
典型相关分析 目的:研究多个变量之间的相关性 方法:利用主成分思想,可以把多个变量与多个变量之间的相关化为两个变量之间的相关. 即找一组系数(向量)l和m, 使新变量U=l’X(1)和V=m’X(2)有最大可能的相关关系. 当前第30页\共有52页\编于星期六\17点 数学: 设两组随机变量 而 的协方差阵S0,均值向量m=0, S的剖分为: 对于前面的新变量U=l’X和V=m’Y Var(U)=Var(l’X)=l’S11l Var(V)=Var(m’Y)=m’S22m Cov(U,V)=l’S12m, rUV=l’S12m/[(l’S11l)(m’S22m)] ? 我们试图在约束条件Var(U)=1, Var(V)=1下寻求 l和m使rUV= Cov(U,V)=l’S12m达到最大. 当前第31页\共有52页\编于星期六\17点 这是Lagrange乘数法求下面f的极大值 经过求偏导数和解方程, 得到l=n=l’S12m=Cov(U,V), 及 因此l2既是A又是B的特征值, 而相应的特征向量为l,m 当前第32页\共有52页\编于星期六\17点 可得到p1对线性组合Ui=l(i)’X, Vi=m(i)’Y,称每一对变量为典型变量. 其极大值 称为第一典型相关系数. 一般只取前几个影响大的典型变量和典型相关系数来分析. A和B的特征根有如下性质: (1)A和B有相同的非零特征根, (2)其数目为p1. A和B的特征根非负. (3) A和B的特征根均在0和1之间. 我们表示这些称为典型相关系数的非零特征值和相应的特征向量为 当前第33页\共有52页\编于星期六\17点 典型变量的性质: (1)X和Y中的一切典型变量都不相关. (2) X和Y的同一对典型变量Ui和Vi之间的相关系数为li, 不同对的Ui和Vj(i≠j)之间不相关. 样本情况, 只要把S用样本协差阵或样本相关阵R代替. 下面回到我们的例子。 当前第34页\共有52页\编于星期六\17点 典型相关系数的显著性检验: 首先看X和Y是否相关,如不相关, 就不必讨论.如果 这是为检验第1个典型相关系数的显著性 检验统计量为 其中 为 的特征根. 当前第35页\共有52页\编于星期六\17点 如果H0为检验第r(rk)个典型相关系数的显著性 检验统计量为 当前第36页\共有52页\编于星期六\17点 当然在实际例子中一般并不知道S。因此在只有样本数据的情况下, 只要把S用样本协差阵或样本相关阵代替就行了。但是这时的特征根可能不在0和1的范围,因此会出现软件输出中的特征根(比如大于1)不等于相关系数的平方的情况,这时,各种软件会给出调整后的相关系数。 当前第37页\共有52页\编于星期六\17点 第十讲典型相关分析演示文稿 当前第1页\共有52页\编于星期六\17点 优选第十讲典型相关分析 当前第2页\共有52页\编于星期六\17点 两个变量时,用线性相关系数研究两个变量之间的线性相关性: 返回 当前第3页\共有52页\编于星期六\17点 典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。 典型相关分析方法最早源于荷泰林(H,Hotelling)于1936年在《生物统计》期刊上发表的一篇论文《两组变式之间的关系》。他所提出的方法经过多年的应用及发展,逐渐达到完善,在70年代臻于成熟。如Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推动了它的应用。 当前第4页\共有52页\编于星期六\17点 * 第一节 典型相关分析的基本思想 如何研究两组变量之间的相关关系呢? 如何进一步确定两组变量在整体上的相关程度呢? 当前第5页\共有52页\编于星期六\17点 通常情况下,为了研究两组变量 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。 当前第6页\共有52页\编于星期六\17点 在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的q个质量指标 和p个原材料的指标 之间的相关关系;可以采用典型相关分析来解决。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。 当前第7页\共有52页\编于星期六\17点 例子(数据tv.txt) 业内人士和观众对于一些电视节目

您可能关注的文档

文档评论(0)

hejiaman2991 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档