普林科技“数据嗨客”机器学习系列讲义之八PCA.docxVIP

  • 3
  • 0
  • 约 7页
  • 2018-04-02 发布于重庆
  • 举报

普林科技“数据嗨客”机器学习系列讲义之八PCA.docx

普林科技“数据嗨客”机器学习系列讲义之八PCA

主成分分析 主成分分析是一种经典的降维方法,但如果你只把主成分分析作为一种降维手段,那么你就太OUT了。主成分的官方解释是这样的: 主成分分析法是将具有一定相关性的多个指标化简为少数几个综合指标的统计分析方法。在原始数据的基础上,利用主成分分析法经过线性变换和舍弃部分信息,可以找出由若干指标组合而成的综合指标,即若干个主成分。而这些主成分就可以尽可能地反映原来指标的特征与信息,同时彼此间相互独立。 除了降维之外,主成分分析还是最经典的无监督学习方法和人脸识别算法之一,著名的“特征脸”就来源于此。 主成分分析的优点有: 利用降维的思想,在保留原始数据信息,最大限度地减少信息丢失的基础上,对高维变量空间进行降维处理,提高模型效率; 对原始变量系统进行最佳的综合与简化,它可以客观地确定各个指标参数的权重,避免主观判别带来的随意性。 主成分分析的缺点有: 降维之后,不能包含原始数据100%的信息; 主成分的解释含义一般带有模糊性,不像原始变量的含义那么清楚、确切。 主成分分析作为人脸识别领域经典的技术之一,由它建立的“特征脸”得到非常广泛的应用,可以描述不同的人脸图像,我们还可以得到不同人脸的“平均脸”,听起来似乎很有趣,接下里我们会详细介绍。图一计算40人所得到的平均脸,图二为主成分分析得到重构脸,分别为5张姿态脸和8张姿态脸训练所得,均包含原始数据90%的信息(71个特征,91个特征)

文档评论(0)

1亿VIP精品文档

相关文档