用孪生网络进行人脸识别与效果分析.docxVIP

下载本文档

7
0
约2.77千字
约 9页
2023-08-19 发布于上海
举报
版权申诉

用孪生网络进行人脸识别与效果分析.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

? ? 用孪生网络进行人脸识别与效果分析 ? ? 火善栋（重庆三峡学院计算机科学与工程学院，重庆 404000） 0 引言到目前为止，人脸识别已经是一项比较成熟的技术，而且成功应用于各种商业领域，但是，这些人脸识别技术不是算法过于复杂，就是技术不够透明。为了克服这些技术壁垒，构建属于自己的人脸识别系统，本文在已有的技术之上，通过构建孪生网络来探索该网络模型在人脸识别上的有效性。人脸识别属于图像分类问题，神经网络模型的传统做法是：先使用大量带标签的图片训练模型，然后让训练好的模型对不在训练集中的图片进行分类，去预测输入的图片属于哪一类。如果采用传统的方法进行人脸识别，就需要把每一个不同的人脸图片做为一个类别，然后采集大量的相同，或不同的人脸在不同状态下的图片进行分类训练，这样造成的问题就是，一方面分类数量庞大，另一方面对个人人脸图片采集的难度也比较大；再者，即使完成了训练，也只能对已经训练过的人脸进行识别，对于陌生的人脸则无法识别。这样，一旦要识别的人群发生变化，整个模型则需要重新进行训练，因此，采用传统的方法进行人脸识别，其网络模型的可扩展性也比较差，不具备实用价值。孪生神经网络是基于两个人工神经网络建立的耦合网络，孪生网络可以利用相同样本对和不同样本对之间的区别，训练出一个网络模型，使同类样本生成的特征向量相近，不同样本的特征向量远离，从而让网络能够识别两张不同人脸的差别，进而达到进行人脸识别的目的。训练孪生网络的主要目的就是提高网络模型的辨别力，对于任意输入的两张人脸图片，网络模型能够识别是同一个人还是两个不同的人，由于网络模型自身的特点，训练好的网络模型可以对已经训练过的人脸图片或者其它任意陌生的人脸图片进行有效的识别，因此，孪生网络的通用性比较好。采用孪生网络进行人脸识别，为了提高识别速度，通常会对要进行识别的人脸图片进行采集并预先计算出特征向量并保存在数据库中，在进行人脸识别的时候只需计算待检测人脸的特征向量，然后与数据库中的特征向量做比较，并通过设置合理的阀值从而达到人脸识别的目的。 1 人脸识别的具体步骤 1.1 构建残差网络［1］采用pytorch［2］构建残差网络，图1为18层残差网络的基本结构，整个网络总体由输入层、残差层和输出层三部分组成。输入层由一个卷积层和一个池化层组成；输出层由一个池化层和一个全连接层组成；残差层由四个残差模块组成，每个残差模块包含有两个残差块，每一个残差块由两个卷积层组成，除第一个残差模块输入和输出向量长宽不变以外，其它残差模块输出向量长宽减少一半，通道数增加一倍，由于本实验采用18层残差网络结构实验效果不是太理想，故采用了34层残差网络结构，34层与18层残差网络结构输入层与输出层是一样的，不同的是每个残差模块中残差块的个数不同，18层网路结构每个残差模块残差块的个数都为2，32层每个残差模块的残差块个数分别为3、4、6、3。图1 18层残差网络结构图 1.2 构建孪生网络［3］以34层残差网络为基本网络结构，构建孪生网络，两个34层残差网络其参数是一样的，其网络结构如图2所示。图2 孪生网络结构图图中Contrastive Loss［1］为损失函数［4］：其中：Dw代表两个样本输出特征向量的欧氏距离（本实验特征向量的长度设置为10）。式（1）中Y为两个样本是否匹配的标签，Y=0代表两个样本相似或者匹配（同一个人脸照片）；Y=1则代表不匹配（不同的人脸照片）；m为设定的阈值（本实验定为2.5）,表示当人脸不相同时，只考虑不相似特征欧式距离在0～m之间的特征差值，当特征距离超过m时，则将其loss看做为0。 ContrastiveLoss损失函数所要达到的目的是：同一个人脸不同照片特征向量的距离越小越好，不同人脸照片特征向量的距离越大越好。 1.3 数据预处理从网上下载数据集（外国人脸数据集，一共有500个不同人的照片，每个人有5张不同状态的照片，累计总共有2500张照片，为了缩短训练时间，本实验只采用了其中的200个人、1000张照片进行训练）；为了去掉图片噪音对人脸识别的影响，采用openCV对这1000张照片进行人脸检测。由于进行人脸检测时，有的图片人脸的检测效果不是太好，为了保证训练人脸图片的质量，最后通过人工的方式对无法检测到人脸的照片或者人脸检测错误的照片进行裁剪，得到正确的人脸图片，其效果如图3所示。图3 人脸检测效果示意图 1.4 网络训练随机从训练集中提取样本数据，以32个样本（正样本和负样本各占50%）作为一个训练批次（注：一次迭代总的训练批次为1000/32=32次），网络总的迭代次数设置为500（网络累计训练次数大约为32×500=16000次），其训练效果如图4所示，从训练结果来看，随着迭代次数的增多，总的趋势是差值越

您可能关注的文档

文档评论（0）

布丁文库 + 关注: 官方认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

认证主体重庆微铭汇信息技术有限公司

IP属地上海

统一社会信用代码/组织机构代码: 91500108305191485W

1亿VIP精品文档

更多 >

用孪生网络进行人脸识别与效果分析.docxVIP