数据挖掘2预处理.pptVIP

  • 6
  • 0
  • 约1.98万字
  • 约 100页
  • 2018-09-04 发布于河北
  • 举报
数据挖掘2预处理

Fisher(1) 找出一最佳投影方向,将N维空间中的点投影到低维空间,如一维空间中,使不同类的点尽可能分离开来。 (1)多重判别分析 设样本集共包含C个类别,这C个互相独立的样本子集记为Xi。假设存在一个变换T,使得经T变换后的矢量y在d维空间获得最大的判断。 为求解这种变换,定义一判断准则R R为类间差别投影与类内差别投影总和之比 P为所求的判别矢量 B为类间散布矩阵 W为类内散布矩阵总和 Ni为第i类的样本数,mi为第i类的平均矢量,m为全部样本集的平均矢量。 Fisher(2) 为求得判别矢量P的最佳值,令R对P求导的结果为零,并经化简、整理后得到一般本征值方程式:(B-λW)P = 0 最终判别矢量可通过求解下列方程而得: Where,λ为B相对于W的本征值,I为单位矩阵 相应于每一个非零的本征值λi,都有一个本征矢量Pi使得: (B-λiW)Pi=0 Fisher(3) (2)Fisher最优判别分析 J.W.Sammon : 首先求出Fisher判别矢量P1: P1=αW-1(m1-m2)=αW-1Δ 为确定构成最优判别平面的第二矢量P2, 可求出R的最大值 在P1应与P2正交的约束条件(P2TP1=0)下,使R最大化可得 是使P1

文档评论(0)

1亿VIP精品文档

相关文档