谱系聚类法分解.pptVIP

  • 97
  • 0
  • 约6.68千字
  • 约 54页
  • 2016-12-02 发布于湖北
  • 举报
二、数据的变换处理 设原始观测数据矩阵为: 中心化变换是一种坐标轴平移处理方法,它是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值. 1、中心化变换 结果使每个变量均值为0,每列数据的平方和是该列变量样本方差的(n—1)倍,任何不同两列数据之交叉乘积是这两列变量样本协方差的(n—1)倍,中心化变换可方便地计算方差与协方差。 2、极差规格化变换 从数据矩阵的每一个变量中找出其最大值和最小值,这两者之差称为极差,然后从每个变量的每个原始数据中减去该变量中的最小值,再除以极差,即有: 变换后,数据矩阵中每个变量的最大数值为1,最小数值为0,其余数据取值均在0-1之间;并且变换后的数据都不再具有量纲,便于不同的变量之间的比较。 3、标准化变换 标准化变换也是对变量的数值和量纲进行类似于规格化变换的一种数据处理方法。首先对每个变量进行中心化变换,然后用该变量的标准差进行标准化。即有: 变换后,每个变量的平均值为0,方差为1,且也具有量纲,同样也便于不同变量之间的比较;数据阵中任何两列数据乘积之和是两个变量相关系数的(n-1)倍,方便计算相关矩阵。 4.对数变换 对数变换是将各个原始数据取对数,将原始数据的对数值作为变换后的新值。即: 三、确定类的个数 在聚类分析过程中类的个数的确定是一个十分困难的问题,人们至今

文档评论(0)

1亿VIP精品文档

相关文档