关于几种相关系数分析方法比较及其应用范围探析.docVIP

关于几种相关系数分析方法比较及其应用范围探析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于几种相关系数分析方法比较及其应用范围探析

关于几种相关系数分析方法比较及其应用范围探析摘 要:变量间具有相关性是对变量作进一步分析的基础,相关系数的探讨和应用很有现实意义。在很多研究中因为没有准确把握不同相关分析方法的原理和应用范围往往存在误用现。文章对几种不同相关系数原理和应用范围做探讨,以期在做研究中能更好的把握这几类相关系数,从而做出科学的推测论断。 关键词:相关系数;简单相关;秩相关;Copula函数 中图分类号:O211 文献标识码:A 文章编号:1674-1723(2012)09-0123-04 一 、引言 相关系数是反映变量之间相关程度和方向的指标,随着数据分析技术的不断发展相关系数体系得到了很大的完善。针对不同数据产生不同相关系数的计算方法,最早由皮尔逊提出的用来描述两个变量间变化趋势状态简单相关系数,即皮尔逊积距相关系数(Pearson product-moment correlation coefficient)。但是不同数据类型相关系数的计算方法上往往是需要改动,而后发展的spearman秩相关系数有称等级相关系数,所针对的数据是定性数据范围内有序数据类型。在一个数据是二元属性的名义数据另一个数据也是二元属性的名义数据时对该类型数据相关系数的分析采用?相关分析方法。如果一个变量数据是二分属性的名义数据另一个变量数据是在该属性值范围内的计量数据或者是计数数据,目前较为合适的处理方法是采用点二列或二列相关系数来衡量两变量之间的相关程度和方向。多变量间相关关系的分析常用的衡量方法是偏相关系数和复相关系数,如果变量数量达到一定规模采用偏相关系数和复相关系数处理方法存在一定的计算难度,典型相关分析可以有效的改变这种状况。数据分布不是直线形式通常是用曲线相关系数来衡量变量间的相关程度。在处理时间序列数据类型一般考虑自相关问题,目前这一块衡量相关系数大小还没有可行的办法,但是在做模型时不消除数据自相关现象会对模型产生很大影响,计量经济学形成了比较成熟的消除自相关的方法。以上这些数据的处理都是建立在简单线性相关系数基础之上并且能够通过简单相关系数推导得到各个类型的相关系数。变量间是非线性状态,一些简单数据能够通过必要转化为线性来求得变量间的相关程度即采用曲线相关系数来计算得到。针对一些复杂分布特征的数据,前面提到衡量直线相关关系的计算方法是没办法很好反应出变量间的相关性。Copula函数即连接函数的提出在一定程度上解决了较为复杂数据相关关系的衡量 问题。 二、常用相关系数与Copula函数的应用探讨 (一)简单相关系数 对于两个要素x与y,如果它们的样本值分别为与yi(i=1,2,...,n),它们之间的相关系数: ,; (1) rxy0,表示正相关,即同向相关;,表示负相关,即异向相关。绝对值越接近于1,两要素关系越密切;越接近于0,两要素关系越不密切。 两变量的直线相关系数是计算其他相关关系的基础,它有如下的特点: 1.线性相关系数满足线性关系。 如那么。 2.在(x,y)服从正态性的假设条件下,线性相关可以充分反应x,y之间的独立性,即若,那么x,y相互对立。在正态性分布假设条件下,线性相关系数同x,y的边缘分布完全决定了(x,y)的联合分布函数,即完全体现了x,y之间的相依关系。 3.线性相关系数的计算比较简单。 (二)偏相关系数 计算复杂多变量的其中两变量的相关关系时往往会受到其他变量的影响而不能真实的衡量出着两者之间相关程度,偏相关系数能够控制其他的变量不变的情况下来估算出两者之间的相关程度,这种方法在一定程度提高了估算的精度。 偏相关系数的计算 保持变量z不变,变量x,y之间的偏相关系数的公式: (2) 控制变量,变量x,y之间的偏相关系数的计算公式: (3) 公式(2)中的是在控制z的条件下,x,y之间的偏相关系数。是变量x,y间的简单相关系数或零阶相关系数。依此类推、分别是变量x,z和变量y,z间的简单相关系数。 本质上来讲偏相关系数是属于线性相关系数,是在多变量情况下线性相关系数的发展形式,以简单相关系数为基础的。线性相关系数研究是在数据正态分布结构下进行的,数据结构在呈现正态特征下分析效果达到最佳。大样本数据的分析时线性相关系数的效果很好,对有限样本的数据的分析在笼统的套用线性相关系数会有很大偏差的。 (三)秩相关系数 Spearman秩相关系数的公式可以表述如下: (4) 式子中D是两变量每一对数据间的等级差距,N表示的样本的数据数量。 秩相关系数要求两变量数据的结构是线性的变化趋势,且不要求数据是正态分布特征,作为线性结构分析的一部分虽然克服了正态分布的限制,且其公式结构可以有简单相关系数导出,秩相关系数和简单相关系数同出

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档