数据预处理祥解.pptVIP

  • 236
  • 0
  • 约 33页
  • 2016-03-11 发布于湖北
  • 举报
数据预处理祥解.ppt

Relief 对象编号 A B C D E F Class 1 0 0 0 0 0 1 0 2 0 0 0 1 1 1 0 3 0 0 1 0 0 1 0 4 0 0 1 1 0 0 1 5 0 1 0 0 0 1 0 6 0 1 0 1 1 1 0 7 1 0 1 0 0 1 1 8 0 1 1 1 0 0 1 9 1 0 1 1 0 0 1 10 1 1 0 0 0 0 1 7.5.2 特征提取 主成分分析,PCA(principle component analysis)最早由Karl Pearson于1901年提出,后经Harold Hotelling发展,是一种经典的统计方法。 它通过对原有变量(属性、特征)进行线性变换,提取反映事物本质的新的变量,同时去除冗余、降低噪音,达到降维的目的。 PCA: 主成分分析 给定数据集D,包括n个对象的数据,每个对象由m个属性A1、A2、…、Am描述。每个对象可以看作m维空间中的一个点。 sepal_length sepal_width petal_length petal_width type 5.7 2.9 4.2 1.3 Iris-versicolor 6.2 2.9 4.3 1.3 Iris-versicolor Feature extraction-PCA ? PCA 计算协方差矩阵C的特征根和主成分矩阵,保留前q 个最大

文档评论(0)

1亿VIP精品文档

相关文档