深度学习及其在人脸识别中应用进展.docVIP

下载本文档

21
0
约7.72千字
约 14页
2018-09-14 发布于福建
举报
版权申诉

深度学习及其在人脸识别中应用进展.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

深度学习及其在人脸识别中应用进展

深度学习及其在人脸识别中应用进展　　摘要：深度学习是目前受到广泛关注的机器学习方法。通过构建深度神经网络且使用深度学习算法学习适合模式识别和分类的高层次特征是目前模式识别领域热门研究方向，特别是在人脸识别领域已经取得了目前最好的成果。文章首先介绍了深度学习概述，然后分析了基于深度学习的人脸识别方法及识别模型并对识别模型进行了分类。最后讨论了应用深度学习进行人脸识别还存在的问题。该文拟对将深度学习应用于人脸识别的研究人员有所帮助。　　关键词：深度学习；特征学习；人脸识别　　在图像分类和识别问题中，我们一般先提取对象特征，然后把特征输入分类器训练分类器，如图1所示。所以首先要面对的核心问题是选取什么样的抽象特征来有效表达图像。如果所选用的特征能够有效地表达图像的本质，那么图像分类和识别就能达到事半功倍的效果。　　在传统的人工智能方法中，图像的特征是依靠人的专业知识和经验人工构建的，近年来研究人员已经构建出了许多比较有效的特征，并且得到较为广泛的应用，例如表达图像几何特征的SIFT特征[ 1 ]，表达图像纹理特征的LBP特征[ 2 ]，表达人脸图像统计特征的特征脸（Eigenface）[3]等。直到现在，人们一直在努力构建出更能反映图像本质的特征，然而，利用人的知识和经验构建特征是一件费时费力的事情，构建的特征也不一定是有效的。因此，人们一直在思考让机器通过自动学习来选取特征的方法。深度学习能够无监督地的从样本中学习到更反映数据本质的特征，从而使得学习到的特征更具有推广性和表达力。近年来受到了广泛的关注。　　最近关于哺乳动物大脑的研究表明，哺乳动物处理输入信息时采用了分层机制[4 - 5]，将输入信息在一个由多层神经元组成的复杂层次结构中传播，每层神经元都会对信息特征进行重新提取和表达。一般情况下，低层神经元提取到的是比较低级的特征，如图像中的线、拐点，这些低级特征又被传播给较高层的神经元，通过层层提取，越高层的神经元提取的特征越高级，如轮廓，形状等，直至提取到信息最高级的特征。机器学习领域的研究人员受到这一研究成果的启发，尝试让计算机模拟人类大脑处理视觉信号的机制，深度学习由此任务而诞生。深度学习（Deep learning）通过层叠基础模型构建一个深度（含有多个隐含层）神经网络，利用高效的学习算法，利用网络中的大量神经元逐层提取对象的抽象特征，每层的神经元接收更底层神经元的输入，将低层特征组合成更高层的抽象特征，并将其输出到更高层的神经元，最终形成适合模式分类和识别的较理想的特征。　　本文首先介绍了深度学习的产生和架构体系，详细介绍了深度信念网络这种经典的深度学习架构，然后分析了基于深度学习的人脸识别方法及识别模型并对识别模型进行了分类。最后讨论了应用深度学习进行人脸识别面临的问题。希望吸引更多的研究人员进行讨论，并取得更好的成果。　　1 深度学习概述　　1.1 深度学习的产生和架构体系　　传统的训练深度神经网络的方法是BP算法，BP算法先随机初始化网络参数，然后利用残差反向传播算法调整网络参数完成训练，但应用BP算法容易陷入局部极值，也容易产生梯度弥散问题。后来人们提出先逐层预训练（layerwise pre-training）网络的初始权值，然后再全局精调（finetuning）整个网络权值的学习算法，逐层预训练是通过无监督学习实现的，精调通过有监督学习实现。这种算法能避免网络陷入局部极值和梯度弥散问题，彻底解决了深度神经网络训练的难题，开启了深度学习研究的热潮。　　根据预训练单元的不同，目前主流的深度学习架构主要有2类，分别是基于限制玻尔兹曼机（RBM）[6]的深度学习架构和基于自编码器（auto-encoder）[7]的深度学习架构，这2类架构都是先通过无监督学习逐层预训练网络初始权值，然后通过有监督学习全局微调网络的方法训练网络的。另外还有一些其它的基于纯有监督学习算法的深度学习架构，比如深度卷积神经网络。目前深度学习架构体系如图2所示。基于限制玻尔兹曼机的深度学习架构的预训练单元是限制玻尔兹曼机，而基于自编码器的深度学习架构的预训练单元是自编码器。　　第一个被提出的深度学习架构就是属于基于限制玻尔兹曼机的深度学习架构，它是层叠限制玻尔兹曼机（Restricted Boltzmarm Machine，RBM）形成的一种深度网络，也被称为深度置信网络（Deep Belief Networks，DBNs）[ 8 ]，是由著名的机器学习泰斗Honton及其学生Salakhutdinov于2006年提出的，目前来说属于比较主流的一种深度学习架构。本节具体介绍深度置信网络架构和学习算法。　　1.2 深度信念网络　　深度信念网络是层叠受限玻尔兹曼机（RBM）形成的一种深度网络