模式识别第讲.pptVIP

  • 0
  • 0
  • 约3.19千字
  • 约 34页
  • 2023-05-18 发布于广东
  • 举报
第一页,共三十四页,2022年,8月28日 第3次课程概要 模式判别 PCA 特征评价 维数比率问题 第二页,共三十四页,2022年,8月28日 PCA Principal component analysis 主元分析 或 主成分分析 功能:简化复杂数据到低维空间,从而发现数据中隐藏的简单结构。 原始数据源(生数据)通常有冗余,包含噪声 PCA的目标:去除冗余,并发现重要特征 PCA 特征评价 维数比率问题 第三页,共三十四页,2022年,8月28日 PCA的大致思路 认为原始数据X是复杂的(有噪声有冗余),要对X重新表示 重新表示后数据的维度即为隐藏于X中的简单结构 PCA 特征评价 维数比率问题 第四页,共三十四页,2022年,8月28日 PCA怎么做? 技术路线 利用线性代数为工具,用另一组基去重新描述数据空间 新的基能够最好地表示原数据X 原有的基是什么样的形式呢?Na?ve basis: 目标:找到另一组基,能最好表达数据集,这个新的基是原有基的线性组合 PCA 特征评价 维数比率问题 采用该方法就隐含了一个假设:线性。数据限制在一个向量空间里,能被一组基表示 第五页,共三十四页,2022年,8月28日 基变换 n个样本 每个样本m个特征 构成m×n的矩阵X P是从X到Y的转换矩阵 几何上,Y由对X旋转拉伸得到 P的行向量构成一组新的基,而Y是在这组基下对X的重

文档评论(0)

1亿VIP精品文档

相关文档