基于人工神经网络的人脸朝向识别模型.docVIP

基于人工神经网络的人脸朝向识别模型.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
18 - 基于人工神经网络的人脸朝向识别模型 基于人工神经网络的人脸朝向识别模型 摘要: 人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是模式识别中一个无法回避的问题。本文针对此问题,建立了基于人工神经网络的人脸朝向识别模型。 首先,采用基于边缘检测Sobel算子的人脸特征向量提取,把图像转换为6行8列像素值,实现了人脸识别的特征提取,作为神经网络的输入。 然后根据实际情况,考虑到误差因素,我们创建一个3层的BP神经网络,输入层8个神经元,输出层3个神经元,中间层17个神经元。选取50张人脸图像中的前30张,作为神经网络的训练样本,通过长达11分钟的训练,我们得到了比较好的网络。接着,把训练好的神经网络用于测试剩余的20张人脸图像,输出的朝向结果与输入的朝向结果完全一致,识别率100%。 在BP网络中,由于我们采用了0.01的学习率,虽然识别率很高,但大大延长了网络的训练时间。因此,我们觉得有必要建立一种训练时间和训练效果都较好的神经网络模型。参照模型一,我们接着又建立了基于LVQ神经网络的人脸朝向识别模型二。用于训练的样本和测试的样本都跟模型一相同。与BP神经网络模型相比,不仅大大缩短了训练时间(缩短为1秒),而且保证了识别率为100%。因此,针对人脸朝向识别的问题,采用基于LVQ神经网络的模型更好一些。 最后,我们从图像特征提取和神经网络构建两个方面出发,提出了可行的模型改进方法。 关键字:人脸朝向识别;BP神经网络模型;LVQ神经网络模型 一、问题的重述 人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是一个无法回避的问题。 现有一组人脸朝向不同角度时的图像数据,图像来自不同的10个人(详见附件),每人五幅图像,人脸的朝向分别为:左方、左前方、前方、右前方和右方。现在需要建立人脸朝向识别模型,对人脸的朝向进行识别。 二、模型假设及符号说明 1、模型的假设 所给的全部人脸图像都未出现损坏等问题; 人脸朝向仅分为5类:左、左前、前、右前、右,其他朝向不予考虑; 对于题目中所给的人脸图像,不考虑人脸的复杂表情问题。 2、符号说明 N输入层的神经元个数 L 隐含层的神经元个数 M输出层的神经元个数 X加到网络的输入矢量 H中间层的输出矢量 Y网络的实际输出矢量 是网络输出单元i到隐单元j的权值 是隐单元j到输出单元k的权值 注:未说明符号在文中用到时注明 三、问题的分析 人脸朝向识别是人脸应用研究中重要的一步,在众多研究领域中,人脸朝向识别是模式识别中一个无法回避的问题。基于误差反向传播算法的多层前馈网络可以以任意精度逼近任意的连续函数, 所以广泛应用于非线性建模、函数逼近、模式分类等方面。 人脸识别的首要一步,也是之后所有过程基础步骤,就是人脸特征的提取,即如何把人脸图像转换为数字特征值。目前人脸特征提取的方法有很多,如主元分析法、Fisher线性判别法、小波分析法等。通过特征向量的提取,作为接下来神经网络的输入。 建立神经网络模型,关键是网络拓扑结构的选择和训练参数的设置。特别是对于BP神经网络来说,参数的设置、样本质量等都是影响结果的重要结果,而学习效率的确定和训练函数的选择直接影响样本的训练时间,还有隐含层神经元个数如何确定等都没有统一的规定。但通过尝试和一些经验公式,完全可以达到很好的输出结果。 由于BP网络固有的缺陷和限制,通过该善网络拓扑结构,即采用有导师监督的LVQ网络,可以在保证人脸朝向识别率的基础上,有效的改善训练时间。而且LVQ网络模型具有简单实用的特点,对于本文所讨论的问题来说具有更好的效果。 基于BP神经网络的人脸朝向识别模型 多层前向反馈式神经网络是目前应用比较广泛的人工神经网络,其中BP(Back Propagation network,简称BP网络)学习算法是最著名的多层前向反馈式神经网络训练算法之一。该算法在图像处理和图像识别领域已经取得令人瞩目的成就,其主要思想是利用已知确定结果的样本模式对网络进行训练,然后利用训练好的网络进行图像的处理或识别。本文将首先讨论用MATLAB实现BP神经网络对人脸朝向的分析。 4.1基于边缘检测Sobel算子的人脸特征向量提取 一个完整的人脸识别系统应该包括人脸检测,特征提取和人脸识别。人脸图像有一些明显的基本特征,如脸部区域通常包括双眼、鼻和嘴等脸部特征,其亮度一般低于周边区域,双眼大致对称,鼻、嘴分布在对称轴上等。本文采用镶嵌图(Mosaic Image,又称马赛克图)方法,先将图像划分成一组相同大小的方格,每个方格的灰度取格中各象素灰度的均值,根据一组规则确定可能为人脸的区域,然后将方格的边长减半,重新构建镶嵌图,并根据一组规则分别定位出眼、鼻、嘴等脸部特征。最后,将所前两步所得到的脸部区域二值化

文档评论(0)

xieliandimei + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档