- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
基于深度学习的人脸识别技术研究
?
?
齐忠文
摘要将深度学习等人工智能技术应用于广播电视节目内容监测中,提出利用人工神经算法解决人脸自动识别问题。探讨BP神经网络主要算法特点,进而给出人脸自动识别流程和方案设计。
关键词深度学习;人工神经网络;人脸识别;BP网络
G2A2096-0360(2018)14-0026-02
随着广播电视的快速发展,传统的人工监听监看方式难以满足内容监管的需要。一些虚假电视医疗广告、购物短片极大损害广播电视作为主流公共媒体的公信力,侵害人民群众利益。部分违规电视广告中虚假专家常常以不同身份,在多个购物短片、医疗广告中扮演不同角色。在电视节目内容监管中,经常需要对上述包含有目标人物的电视节目进行快速分类,准确鉴别。面对海量电视节目,紧靠人工肉眼难以及时准确发现违规节目,因此,我们考虑利用深度学习技术应用在人脸自动识别中,对目标人物人脸进行智能识别,从而提高监测监管自动化程度,迅速发现及时处置违规节目。
1深度学习技术
深度学习是人工智能研究一个重要的研究部分。它汲取了多个学科的研究成果。包括数学、统计学、信息学、通信原理、计算机基础理论乃至哲学、心理学等方面的研究支持。换个角度来讲,深度学习可以看作利用计算机科技模拟人类学习思考过程,从已知的激励响应、函数结果中,不断迭代优化函数模型,进而在提供新变量数据时,系统根据模型判断出即将产生的激励结果。近年来,受益于计算机和互联网等信息技术的发展成就,深度学习在人工智能研究中得到飞速发展。在语音识别、辅助判定方面,研究成果颇丰。在视频自动识别领域,深度学习也得到了积极应用。同语音智能识别相比,视频图像自动识别更加复杂。
2人工神经网络基本原理
人工神经网络技术是采用计算机、网络等技术模仿生物神经网络的研究。人工神经网络具有非线性、非有限性、非稳定状态和非平衡性等特性。
1)非线性。自然界中大部分系统都是非线性的,我们将人工神经网络中的神经元设置于开关两种状态,进而模拟非线性系统。
2)非有限性。神经网络系统的响应,不只取决于单个单元,而取决于相互影响的多个单元。
3)非稳定状态。人工神经网络判定性能不是一成不变的,而是通过数据迭代,系统性能不断提升进化完善。
4)非平衡性。通过数据迭代,性能不断提升过程中,影响系统性能的单元并不均衡。某种状态下,性能提升往往取决于特定函数的提升过程。
经过测试比较,目前,比较好的算法是基于反向传播算法。基于反向传播算法基本原理是通过输入激励和系统响应修正的不断优化,来逐渐提升系统判定能力。分为两个阶段来完成,首先是激励的正向输入,然后是不断逼近测试结果的系统调整。早期反向传播网络只有三层,inputlayer、hiddenlayer和outputlayer。受限于当时计算机硬件性能影响,基于反向传播算法耗时较长,并未得到进一步发展。近年来,随着信息网络计算的进一步发展,计算机计算性能大幅提升。并受益于大数据、云计算等信息技术发展。基于反向传播算法的深度神经网络分析再次走入人们视野,展示出其应用价值。
人工神经网络算法最大的优势是,系统自动提取待检样本的特征。我们无需对样本进行分解处理,这同以往的检测识别方法相比,不仅节省了时间,简化了流程,还提高了系统的鲁棒性。例如在检测电视节目中单帧画面的时候,人工神经网络系统自动提取画面像素中的隐含特征。此外,利用人工神经网络系统,各个人造神经元同时独立工作,也提高了系统运算效率。
3电视节目中人脸画面识别处理
在电视节目人脸画面中,存在人脸之外的无关信息。这些无关信息会对系统自动识别带来干扰,增加系统负担。另外也会导致系统迭代结果达不到优化效果。因此,首先,我们需要将节目画面中人脸以外的节目信息过滤掉。
1)人脸侦测。人脸侦测的任务是在视频节目每一帧画面当中,检测是否有人脸存在,并去除人脸以外信息,将人脸画面提取出来。早期人脸侦测主要依靠与模板比对,通过色泽,对比度等信息比较完成。缺点是耗时长,识别率低。利用BP网络的侦测设计,可以很好解决以上问题。Multi-taskconvolutionalneuralnetworks算法是我国深圳一家研究院提出的人脸侦测算法。一般来讲,第一层p-net作用为控制人脸边缘区域,并对同一人物画面归一化。第二层r-net作用为进一步确认人脸位置区域,去除第一层确认的非人脸区域。第三层可以理解为第二层深化,人脸部位区域更加准确。
电视节目中的人脸姿态千变万化,颜色、大小、方向各不相同,如果不加处理即进行分类训练,增加了后续分类判定的难度和准确性。因此,需要对不同姿态类别的人脸进行规范化处理,形成规范统一的人脸预处理样本。目前比较好的归一化方法一般采用仿射变换,即对电视图像中的人脸进行平移缩放,规范至画面中央。
文档评论(0)