浅谈模式识别第3讲.pptVIP

  • 2
  • 0
  • 约3.98千字
  • 约 34页
  • 2017-07-07 发布于湖北
  • 举报
模式识别 模式识别——原理、方法及应用 第3次课程概要 模式判别 PCA 特征评价 维数比率问题 PCA Principal component analysis 主元分析 或 主成分分析 功能:简化复杂数据到低维空间,从而发现数据中隐藏的简单结构。 原始数据源(生数据)通常有冗余,包含噪声 PCA的目标:去除冗余,并发现重要特征 PCA的大致思路 认为原始数据X是复杂的(有噪声有冗余),要对X重新表示 重新表示后数据的维度即为隐藏于X中的简单结构 PCA怎么做? 技术路线 利用线性代数为工具,用另一组基去重新描述数据空间 新的基能够最好地表示原数据X 原有的基是什么样的形式呢?Na?ve basis: 目标:找到另一组基,能最好表达数据集,这个新的基是原有基的线性组合 基变换 n个样本 每个样本m个特征 构成m×n的矩阵X P是从X到Y的转换矩阵 几何上,Y由对X旋转拉伸得到 P的行向量构成一组新的基,而Y是在这组基下对X的重新表示 在线性的假设条件下,要解答 要寻求一组变换后的基,也就是P的行向量{p1, … pm} 这组基就是X的主元 要解答的问题 1 我们要将X转换成为的Y是个什么样子? 2 对应于Y,如何求解P? 我们要将X转换成为的Y是个什么样子? 回顾一下PCA要解决的问题,数据复杂混乱 噪声 冗余 重要特征和噪声的数学描述 信噪比 要使得信噪比大

文档评论(0)

1亿VIP精品文档

相关文档