第八章-特征选择及提取
;问题;目录;背景;背景;背景;?;目录;特征选择;特征选择;特征选择;目录;子集搜索;子集评估;搜索一个特征子集,我们希望 :
样本类内的距离尽可能小
样本类间距离尽可能大
;基于距离的判据;基于概率密度的判据;基于概率密度的判据;19;基于概率密度的判据;基于概率密度的判据;22;23;24;特征选择;特征选择;过滤式;过滤式;Relief-F[Kononenko, 1994] ;包裹式;包裹式;包裹式;嵌入式;嵌入式;总结;目录;特征提取;特征提取的方法;39;PCA;41;PCA;PCA;PCA;LDA(线性判别分析)
LDA是Fisher线性判别分析的一般形式,通过特征的线性组合实现两类或者多类数据的分离。LDA在统计、模式识别和机器学习中具有广泛应用;46;线性判别分析;48;线性判别分析;Linear Discriminant Analysis;;?;53;线性判别分析;为什么维度上限是C-1?;特点:
监督的方法,可提取出具有判别性的特征
LDA最多只能将特征降低到C-1维
LDA方法需要数据服从高斯分布
容易出现过拟合 ;57;Kernel-PCA;59;Kernel-PCA;Kernel-PCA;Kernel-PCA;Isomap;64;65;优点:
对于流形分布的数据,在低维空间中保留了数据 之间的本质距离,全局结构得以保持
缺点:
降维过程没有考虑类别区分性保持
现实的测地距离较难计算;LLE;LLE;优点:
是一种非线性映射方法
可以保留局部本质邻域结构
局限:
该方法是一种局部的方法
对噪声较敏感;目录;讨论;讨论;总结;Resources;Home work;;77
原创力文档

文档评论(0)