相關系数矩阵的逆矩阵与行列式的内涵分析20130205-王惠文.docxVIP

相關系数矩阵的逆矩阵与行列式的内涵分析20130205-王惠文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相關系数矩阵的逆矩阵与行列式的内涵分析20130205-王惠文

相关系数矩阵的逆矩阵与行列式的内涵分析 【摘要】相关系数矩阵是用于表现变量之间相关关系的统计分析工具。然而,多元变量之间的相关关系极易受各种复杂因素的影响,因此并不能仅仅依据该矩阵中的数值来解释变量间的关系。而利用偏相关系数则可以进一步地反映变量间的本质联系。本文系统研究了相关系数矩阵的逆矩阵与行列式中的深刻内涵,一方面讨论了相关系数矩阵的逆矩阵与偏相关系数之间的数量联系;另一方面,从数学上证明了相关系数矩阵的行列式与变量间各阶次偏相关系数的等式关系。此外,论文还进一步指出这些研究结论在多元线性回归建模中的指导意义。 【关键词】相关系数矩阵偏相关系数多元线性回归分析 中图分类号:O212.4文献标识码:A 一、引言 1877年,Francis Galton 在一次演讲中用“复原”(reversion)一词定义了甜豆苗母代与子代之间物理特性的关系[1],这是历史早期人们对相关性概念的理解。从那以后,许多科学家不断尝试,希望创造一种方法来测量两变量的相关性大小。Karl Pearson在1895年提出了Pearson相关系数(Pearson Product-Moment Correlation Coefficient),并给出了计算公式。 在此之后,人们又创造性地提出了若干种等价的计算方式。最有代表性的是Rodgers和Nicewander(1988)[2],他们在总结前人成果的基础上,从13种不同的角度来解读Pearson相关系数,为相关系数的广泛应用做出了重要贡献。在Pearson相关系数的基础上,关于相关性问题的深入研究也在不断继续。如Fisher(1925)[3]详细解释了偏相关系数、序列相关等;Lord(1968)[4]说明了偏相关、复相关与多元线性回归的关系;国内的学者如马江洪(1994)[5]在讨论多元线性回归分析中的复杂相关性问题时,推导了偏相关系数的计算公式;王海燕(2006)[6]等比较了偏相关系数与标准化系数,得到了二者的数量关系和统计意义。除此之外,偏相关系数、半偏相关系数的区别和应用日益受到重视[7,8];相关分析、偏相关分析也逐步应用于医学、信号处理等领域[9,10];尾部相关系数、多相关系数等延伸概念也被提出和解释[11,12]。时至今日,Pearson相关系数及与其有关的拓展应用,已成为仍然是统计上的重要方法领域的热点研究问题。(“应用”不适合称为“方法”) 本文以Pearson相关系数矩阵(以下简称为相关系数矩阵)为出发点,对相关系数矩阵的两种最基本的代数变换形式——逆矩阵、行列式中隐含的信息进行研究。在文章的第二部分,通过一个实例说明了相关系数矩阵在解释多元相关关系时的缺陷;第三部分则系统讨论了相关系数矩阵的逆矩阵与偏相关系数之间的数量关系;第四部分重点研究了相关系数矩阵行列式所包含的内涵信息,从数学上证明了相关系数矩阵行列式与变量间各阶次偏相关系数的等式关系;此外,还进一步讨论了这些研究结论对多元线性回归建模的指导意义。 二、相关系数矩阵及其局限性 为了充分认识研究相关系数矩阵与偏相关系数之间联系的重要性,本节将通过一个实例来说明相关系数矩阵的局限性。 1.相关系数矩阵 首先给出一些必要的数学符号。由于数据的中心化不会改变变量间的相关性,所以为叙述简便,如不特殊说明,本文以下提到的变量均是中心化数据(即每个变量的均值为0)。 对于一个有p个变量和n个观测的数据集合,其中每一个变量。则的相关系数矩阵被记为: (1) 注意到每一个变量均为中心化的,所以有与之间的简单相关系数为, , (2) 对于矩阵,它有两个最基本的代数变换形式,即逆矩阵和行列式。本文将系统研究这两种代数变换中所隐含的更加深刻的相关性信息。 如果相关系数矩阵是可逆矩阵,记的逆矩阵为: (3) 此外,将相关系数矩阵的行列式记为。 2.相关系数矩阵的局限性 在相关系数矩阵中,每个元素是两个变量与之间的简单相关系数。一般地,它可用于测量这两个变量之间的相关程度。然而值得注意的是,在多元分析问题中,由于变量之间的相关关系会受到更多交错复杂的因素影响,其相关程度往往无法从简单相关系数矩阵中得到准确的反映。 例如,JoneNeter(1990)曾利用一套脂肪数据来说明变量多重相关问题的隐蔽性和复杂性[13,14]。这套数据中有3个变量,分别是三头肌皮褶厚度,大腿围长、中臂围长。这3个变量之间的简单相关系数矩阵如表1所示: 表1 脂肪数据的相关系数 变量名称 三头肌皮褶厚度 大腿围长 中臂围长 三头肌皮褶厚度 1 0.9238 0.4578 大腿围长 0.9238 1 0.0847 中臂围长 0.45

文档评论(0)

sd47f8cI + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档