相关性度量及指标聚类方法的改进.pfg.pdf

相关性度量及指标聚类方法的改进 摘要: 本文先给出了随机向量间的相关性度量:简单相关、复相关、典型相关和广义相关系数 的叙述。它们均为刻画两个随机向量(或变量)间的线性相关程度,而不能解决刻画多个(特 别是多于两个的)随机变量构成的随机向量的内在的相关性。S.Kullbackl959年提出的判别 信息量,直接去度量两个密度之间的差异,用它引出的随机向量的内在相关性的度量,与以 往的相关系数不同,它的大小可以到达无穷,能够更细致的区分相关性。并它是一种内部的 相关性,可以是非线性的。 本文利用判别信息量来刻画两个随机向量间独立性的度量,进而由阿达玛不等式得到随 机向量内在的相关性的度量。并用它改进了指标聚类的一种方法。在这里我们解决了如下两 个问题,第一,在技术上引进惩罚因子,以解决当一个随机向量的分量增多时随机向量内在 相关性度量随之加大,而无法用它来比较大小不同的两个随机向量的内在相关性的问题。第 二,在理论上,改进的指标聚类方法,缺乏并类距离的单调性,为此我们证明了,在很一般 的条件下,并类距离的单调性是满足的。 作为应用,我们根据2005、2006年7.10月对塔里木河(简称塔河)下游断流区6条 样带38块样地外业调查数据,用改进了的指标聚类的方法,对塔河下游的物种进行分类, 并与传统方法的聚类结果进行比较,说明用两类所含所有指标间的内在相关性度量对指标进 行分类,比传统的从简单相关阵出发,对指标系统聚类的方法要精细、准确。 关键词:广义相关系数,向量的内在相关性,指标聚类分析,生态种组 区高校科研计划项目(XJEDU2004119)部分内容 Thecorrelationmeasuresandthe of for improvementclustering variables Abstract: This thecorrelationsofrandom paperanalysis variables:simplecorrelation,multiple correlationand can linear correlations,canonical only identify generalizedcorrelation.Hey correlationbetweentwovariablesbutcannot theinnerrelationofvariables thoroughlyexplain introducedthediscriminantfunctiontoevaluatethelikelihood morethantwo.In1959S.Kullback oftwodistributions theinnerrelationofrandomvariables.Unlikethe consequentlyportrays correlation valueofdiscriminantfunctioncanbe canbemore former coefficent,the infinite,it anditisaninner benonlinear. specific correlation,can articleUSeSdiscriminantfunctionto the oftworandomvariables This portrayindependence and theinnerrelationsofa randomvectorHadamard and the gained

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档