- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
救援机器人中人脸检测、定位和跟踪系统模型.doc
救援机器人中人脸检测、定位和跟踪系统模型
摘 要:本文提出了一种在救援机器人中实现人脸检测、定位和跟踪的可行方案。首先通过摄像头将救援机器人周围的场景转化成数字图像,进行预处理后,使之成为易于检测和定位的图像,然后运用图像分割技术找到感兴趣的目标并进行定位,最后使用CamShift算法跟踪运动的人脸并驱动电机转动。
关键词:机器人;人脸识别;人脸检测与定位;人脸跟踪;CamShift
1 引言
目前,机器人的高度智能化和自主化是机器人学中两个重要的研究方向,随之而来的应用也越来越广泛。2008年北京奥运会曾使用过三种机器人:福娃机器人、翻译机器人和安保机器人。2011年3月,里氏9.0级地震引发日本福岛第一核电站发生核泄漏事故,图1为遥控机器人“Packbot”正在福岛第一核电站3号反应堆所在建筑内进行拍照、测量放射水平等工作。
1.1 救援机器人的基本功能模块
作为救援机器人,一般有用户控制,自主决策控制,传感/基础决策,运动/执行等几个子系统组成[1],其结构如图2所示。其中视觉系统实现对环境的实时感知,是救援机器人系统组成的重要部分。救援机器人通过摄像机等视觉传感器获取现场环境的二维图像,并利用视觉处理器进行分析和解释,让救援机器人能够识别物体并确定其位置。运动控制系统和执行系统远端PC和车载PC的控制命令完成执行动作,车载PC则对各个系统进行协调和控制,并与远端PC共同实现智能化的推理和决策。
本文提出了一种将人脸检测、定位和跟踪功能加入到视觉系统中的可行的模型,即通过主动摄像机从各种不同的场景中检测出人脸的存在并确定其位置,然后驱动摄像头做出反应。
1.2 研究的目的和意义
本研究基于救援机器人视觉系统中的人脸检测、定位和跟踪,但却有着人脸识别的普遍意义[2],主要以下两个方面:
1.2.1 促进相关学科发展
人脸检测、定位和跟踪问题的解决既涉及到模式识别,图像处理、分析与理解、计算机视觉、计算机图形学、人工智能、人机交互等计算机相关领域,也采用了认知科学、神经计算、生理学、心理学等相关专业知识。它的解决对构建这些学科领域的基础实验平台,用于尝试新方法,验证新理论,解释新现象非常有利。它还是一个非常好的教学平台,通过它可以使学生将理论与实践相结合,提高学生的动手能力、创造能力和综合能力,符合目前国家提倡的课程改革与素质教育的要求。
1.2.2 具有巨大的应用前景
如今,需要进行身份认证的地方越来越多,如在银行的ATM上进行金融业务时需要输入密码,进入自己的计算机系统则需要输入用户名和密码,登录电子邮箱时的用户名和密码等等。但是,目前采用的身份证、钥匙、用户名、密码等方式,安全性、可靠性和方便性较差。人脸识别作为一种典型的生物特征识别技术,以其自然性、高可接受性等优点受到了人们的青睐,可应用于各行各业中,具体来说可分为如下几类:
⑴访问控制。在安全性要求较高的地方如政府、医院,或某些公共场所,可以建立无门卫的门禁系统。
⑵司法应用。常见的是嫌犯(mug shot)识别,基本方法是对比目标特征和数据库存贮特征的相似性。
⑶电子商务。在在线金融、贸易活动中,人脸识别可以提供客户的身份认证,并保证商业活动无拒付地良性运转。
⑷视频监控。利用人脸识别技术,监控者可以从大街上或进入大楼、机场的人群中找到自己要找的人。
2 图像处理
2.1 人脸检测与定位系统的构成
人类感知外部世界是通过视觉、听觉、触觉和嗅觉等感觉器官,对于救援机器人,则是通过视觉系统来模拟人类视觉功能,其中大量运用了数字图像处理、计算机图形学等技术。救援机器人视觉系统主要包括数字图像获取、图像预处理、特征提取和图像识别等几个功能模块,如图3所示。
在数字图像获取阶段,通过光学成像和数字化将救援机器人周围的场景转化成数字图像;在预处理部分,利用图像滤波、几何变换、像素插值等方法将数字图像进行初步调整,使之成为易于检测和定位的图像;在特征提取部分,对图像进行抽象化,从而将图像的纹理特征、颜色特征、形状特征[3]等提取出来;在识别部分,系统将上一步获得的特征与数据库中的特征进行模式匹配,从而在图像中找到感兴趣的目标并进行定位。
2.2 图像分割方法
利用救援机器人的摄像头,经过预处理便得到所需的图像。怎样从图像中获得我们感兴趣的目标区域,是人脸检测和定位的关键步骤。本文利用图像分割技术对目标进行特征提取和参数测量,进而实现人脸检测和定位。图4列出来了常用的图像分割方法。
3 人脸跟踪和电机控制方法
3.1 人脸跟踪算法
人脸检测和定位完成后,得到人脸图像区域。然后使用CamShift算法[4](Conti
文档评论(0)