一种基于深度图像手势识别算法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于深度图像手势识别算法

一种基于深度图像的手势识别算法   摘要:利用Kinect捕捉深度图像,使用有效的手势分割手段将手势区域截取并运用相关算法对手势进行轮廓、凸包及其最小外接圆提取;然后构建了4种手势特性参数并给出了4种参数的计算方法;最后综合手势特性参数构建分类决策树以实现手势识别。实验针对9种常见手势在复杂背景条件下进行测试,单个手势识别率在89%100%之间,综合识别率达到96%。   关键词:手势识别;Kinect传感器;人机交互   中图分类号:TP391.4文献标识码:A文章编号:1005-3824(2014)02-0022-05   0引言   手势识别在人机交互的发展过程中起着不可或缺的作用,是实现真正自然的人机交互的一个至关重要的技术。该技术利用各类图像,使得机器能够经过处理获得人类手势信息,进行相应的手势识别,从而达到人机自然交互的目的。这项关键技术在人机交互领域应用十分广泛:如手术室、展示厅等不方便使用外设输入设备的场合。由于巨大的应用前景,手势识别成为目前研究的热点,出现了许多研究方法,如杨波等针对复杂背景采用空间分布特征对手势进行识别[1],这种方法尽管在理想状态下识别率不错,但是其识别率受到光线强弱极大的影响; Frati提出了利用数据手套进行手势识别的方法[2],该方法尽管准确率能够得到保证,但是用户体验并不是十分友好。近年来,由于硬件厂商在自然人机交互设备开发上付出了努力,成功地开发出了一系列深度图像传感器,如Microsoft的Kinect等。这使得基于深度图像的手势识别成为了又一个研究热点,如Zhou Ren提出的利用Kinect基于手指的EMD的鲁棒性手势识别方法[3]。基于Kinect深度图像的方法相较于前述的数据手套以及基于RGB图像有很大的改进,用户体验以及抗干扰性都有提升。尽管如此,该领域研究还处于初级阶段,如李瑞峰等[4]提出的手势识别方法无法很好地识别例如握拳、五指并拢的手掌类没有单独手指显现特征的常用手势,而Yan Wen[5]的方法则无法识别具体的手势。由于受硬件性能以及手势的复杂程度等客观因素的影响,目前提出的识别方法都有各种缺点很难在实际中应用。   为了能够克服上述缺点,本文提出了一种新的基于深度图像的手势识别方法:首先利用有效的分割算法分割手势区域,进而提取该区域轮廓、凸包及其最小外接圆;然后计算手势特性参数;最后综合手势特性参数构建分类决策树以实现手势识别。同时,利用复杂背景条件下的9种常见手势真实数据对该方法进行测试,实验结果表明该方法具有有效性。   1手势区域切割及轮廓、凸包提取   手势识别的整体流程如图1所示。在进行手势识别之前,必须先对手势区域进行有效分割,以确保明显的手势特征能够被深度传感器采集捕捉,并且不受身体其他部位干扰。另外,为实现本文提出的手势识别方法,需要计算特征参数。这些参数需要利用手势轮廓及凸包进行计算,故而需先行对采集深度图像进行预处理。   1.1手势区域分割   本文中所做实验采集数据由Kinect传感器采集得到,其空间分辨率为320×240。数据采集过程中,使用者应该处于Kinect有效范围内,且尽量正对传感器,这样可以确保分割的正确性。   Kinect深度图像每一像素对应深度数据长度为16 bit,其中前13 bit为深度数据,后3 bit为自带用户标志位,为Kinect自带算法对用户进行识别的编号。Kinect自身的用户识别算法比较完善,且本文重点并不在于如何实现手势分割,故而本文采用Kinect自带的用户识别算法进行识别。然后,利用深度数据自带用户标识位,对深度图像中用户进行标识,并生成256级灰度图。每种灰度对应8504 000 mm深度范围,小于850 mm则识别为距离过近,13 bit深度数据为0,大于4 000 mm距离则识别为距离过远。计算所得灰度图像的直方图,即统计每个深度级的像素个数,以此反应图像中每级深度出现的频率,如图2所示。从离摄像头较近区域(即深度较浅处)开始判断筛选,通过判断用户身体范围内深度直方图像素点松散性以及数量(已标识的用户深度图像内像素数主要有2簇,手势位于身体前端,故而直方图内深度较小、像素较少的一组即为手势深度区域,如图3所示。)确定手势大体深度区域。   1.2轮廓、凸包及其外接圆提取   利用轮廓查找算法[6]提取轮廓信息;再利用相关算法[7]分别对已提取轮廓计算其凸包;最后利用最小外接圆算法[8]提取外接圆,分别如图5a,5b,5c所示。结束后,储存轮廓、凸包以及最小外接圆信息以供特征参数计算时调用[9]。   2.1手势特征参数计算   本文计算的特征参数包括:有效凸缺陷数(DCD)、有效凸缺陷特征夹角(DCDA)、轮廓与其外接圆面积比(CCR)和凸包有效外接圆顶

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档