CNN深度学习模型用于表情特征提取方法探究_张昭旭.docx

下载文档 降价啦

61
0
约5.66千字
约 6页
2016-11-27 发布于浙江
举报
版权申诉
保障服务

CNN深度学习模型用于表情特征提取方法探究_张昭旭.docx

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

CNN深度学习模型用于表情特征提取方法探究_张昭旭

图形图像文章编号：1007-1423（2016）03-0041-04DOI：10.3969/j.issn.1007-1423.2016.03.010CNN 深度学习模型用于表情特征提取方法探究张昭旭（四川大学计算机学院，成都610065）摘要：卷积神经网络（CNN）作为一种深度学习架构，在精确提取图像特征的同时降低模型复杂度。针对 CNN 在图像识别方面的优势，提出一种基于 CNN 的人脸表情特征提取方法。使用具有 8 层网络结构的 AlexNet 模型对融合的人脸表情图像进行特征提取，再使用支持向量机（SVM）进行分类预测。将预测结果与一些经典方法如 SVM、PCA 等做比较，可以发现在样本图片拍摄条件变化较大的情况下，CNN 在提取图像本质特征方面有其他方法不可比拟的效果。关键词：深度学习；卷积神经网络； AlexNet；人脸表情识别；特征提取引言近年来，人机智能交互引起人们越来越多的兴趣，尤其是通过语音和肢体动作来进行人机交互的方法。面部表情识别对于机器理解和识别人类情绪有至关重要的作用[1]。人脸面部表情识别的方法很多，根据提取特征的不同分为基于运动与基于形变的表情特征提取。基于运动的特征提取方法，是根据表情图像的特征点相对位置和距离变动，反映表情变化，包括光流法、运动模型、特征点跟踪等。基于形变的特征提取方法，使用活动外观模型（AAM）、点分布模型（PDM）等基于模型的方法，或 Gabor 变换、主成分分析（PCA）等基于图像的方法，获取面部图像形状或纹理上的变化特征[2]。深度学习（Deep Learning，DL）是机器学习研究中的一个新的领域，源自人工神经网络，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释图像、声音、文本等数据。深度学习属于无监督学习，通过组合低层特征形成更加抽象的高层特征或属性特征，以发现数据的分布式特征表示，学习更有用的特征，从而最终提高分类或预测的准确性[3]。卷积神经网络（CNN）是深度学习框架的一种。 CNN 的特征检测层通过训练数据进行学习，所以在使用 CNN时，避免了显式的特征抽取，而隐式地从训练数据中进行学习；再者由于同一特征映射面上的神经元权值相同，所以网络可以并行学习。CNN 以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性，其布局更接近于实际的生物神经网络，权值共享降低了网络的复杂性，特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度[5]。卷积神经网络（CNN）CNN 的网络结构积神经网络（CNN）是一个多层的神经网络，它的基本结构就是输入层、卷积层（conv）、子采样层（pool-ing）、全连接层、输出层（分类器）。一个经典的 CNN 结构如图 1 所示。N图 1 一个经典的 CNN 结构图现代计算机2016.01 下趮趧图形图像（1）卷积网络中层与层之间变换都是一个特征提取的过程，得到的每一层由多个二维平面组成，每个平面为特征处理后的特征映射图（feature map，简称 fm）。输入层原始图像，网络中的每一个特征提取层（卷积层）都紧跟着一个二次提取的计算层（子采样层），这种特有二次特征提取结构使得卷积网络对输入数据有较大形变时具有一定的容忍能力。卷积层+子采样层一般会有若干个，具体的操作过程如下：①卷积过程：用一个可训练滤波器 fx 对输入图像（或上一层的 feature map）进行卷积处理，而后加上偏置 bx，得到卷积层 Cx；②子采样过程：对每个邻域内四个像素求和得到一个像素，通过标量 Wx+1 加权，然后增加偏置 bx+1，再通过一个 sigmoid 激活函数，得到一个缩小约为 1/4的特征映射图 Sx+1。卷积和子采样的过程如图 2 所示。图 2 卷积和子采样过程图卷积层是特征提取层，使用卷积运算可以使原信号特征得到增强，同时降低噪音。子采样层用于二次特征提取，可看作一个模糊滤波器。（2）全连接层（F 层）相当于传统神经网络中多层感知机（MLP）中的隐含层（HiddenLayer），与上一层是全连接的，计算过程是将上一层输出结果乘以权重向量，再加上一个偏置，然后将其传给 sigmoid 函数。（3）输出层，及分类层，由欧式径向基函数（Eu-clidean Radial Basis Function）单元组成，每个类别对应一个单元。输出层使用 Logistics 回归，计算输入样本属于各类别的概率。CNN 用于图像分类CNN 是人工神经网络的一种，是当前语音分析和图像识别领域的研究热点，其最著名的特点是局部感受野和权值共享