一种基于改进DTW算法的动态手势识别方法.docVIP

一种基于改进DTW算法的动态手势识别方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于改进DTW算法的动态手势识别方法.doc

一种基于改进DTW算法的动态手势识别方法   摘要:结合Kinect传感器提出了一种基于改进的DTW算法的动态手势识别方法。首先,通过SDK对Kinect传感器获得的深度信息进行分析,获得人体骨骼点3D位置,选取其中4个点作为手部运动特征;然后,用加权距离和全局路径限制的方法对传统的DTW算法进行改进;最后,用改进的DTW算法进行模板训练和实现动态手势的识别。实验表明:该方法能很好地实现动态手势的识别,实时性好,在背景干扰和光照方面有较强的鲁棒性,较传统的DTW算法在识别速度和识别正确率方面有所提高。   关键词:动态手势识别;Kinect传感器;改进的DTW算法   中国分类号:TP391?4文献标识码:A文章编号2013   0引言   手势识别是人机交互中的一种重要手段[12],动态手势具有直观性和自然性等特点,一直是国内外研究的重点。Britta Baue等人[3]利用单摄像头获取图像信息并利用KMeans算法自组织聚类基元,基于HMM模型训练和实时识别手语;Zhang等人[4]提出使用HMM算法来进行中文手语视频检索;Silanom等人[5]提出了根据手势运动分析识别泰文字母的方法。然而,以上基于视觉的动态手势的识别容易受到光照、复杂背景和算法复杂度等因素的影响,识别率和实时性受到限制。本文采用微软的Kinect传感器替换普通摄像头,获取深度数据,对深度数据进行动态手势分割,再用一种改进的DTW算法进行动态手势识别,克服了光照和复杂背景的干扰,降低了算法的复杂度,有效地提高了动态手势识别的稳定性和实时性。   1Kinect传感器获取特征   1.1Kinect传感器简介   Kinect是微软为其Xbox 360游戏主机和Windows平台PC打造的一款运动感知输入设备,作为一款体感外设,它实际上是一个采用全新空间定位技术(light coding)的3D体感摄像头[6]。Kinect一共有3个摄像头,中间一个是RGB摄像头,用来捕获640×480的彩色图像,每秒最多获取30帧图像;两边的是2个深度传感器,左边是红外线发射器,右边是红外线接收器,用来检测玩家的相对位置。   1.2特征提取   用Kinect传感器获得骨骼点的位置[7],用Kinect for windows SDK实时追踪人体全身的20个3维骨骼点坐标,如图1所示。 该3D坐标信息不易受到背景、灯光、摄像头以及人体肤色等因素的影响。选择20个骨骼点中4个点作为特征处理,分别为左手、右手、左肩和右肩。   图120个骨骼点示意图   注:1.右脚;2.左脚;3.右脚踝;4.左脚踝;5.右膝盖;   6.左膝盖;7.右髋;8.左髋;9.髋部中心;10.脊柱;   11.肩膀中心;12.头部;13.右手;14.左手;15.右手腕;16.左手腕;17.右肘部;18.左肘部;19.右肩;   20.左肩一个特征向量可以表示为 Fn=(x1,y1,z1,x2,y2,z2,…,x4,y4,z4)其中,n为tn时刻的骨骼索引(一个手势序列包含n个这样的特征向量)。骨骼点左右手的运动代表了手部的运动,左肩右肩的运动相对较小,其位置可以用基准点来计算。取左肩和右肩的中心点为基准点,表示为A(xa,ya,za)=12(x3+x4,y3+y4,z3+z4),(1)得到基准点后,我们可以对特征向量进行归一化,定义O后=O-A|L-R|,(2)式(2)中:A为计算出的基准点在原有坐标系对应的向量;O为归一化前骨骼点对应的向量;O后为归一化后骨骼点对应的向量;L为左肩对应的向量;R为右肩对应的向量。   这样,我们就可以将原有的人体化坐标系转换到以双肩中心点为原点的双手坐标系。消除人体的尺寸和离摄像头距离的远近对特征向量引起的变化。   2DTW算法识别   DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,能够对有全局或局部扩展、压缩或者变形的模式完成匹配过程[8]。DTW算法就是在2个模式,即测试模式和参考模式的特征信号之间建立一条科学的时间校准匹配路径。   我们设R=(r1,r2,r3,…,rn)为手势测试序列,T=(t1,t2,t3,…,tm)为手势模板序列,n,m都是手势帧的时序标号,通过非线性映射匹配时间序列,因此一个映射可以用一系列有序元素表示:(i1,j1),(i2,j2),(i3,j3),…,(if,jf),元素(i,j)表示测试序列R第i帧的特征向量与模板序列T第j帧的特征向量之间的映射,f映射个数定义d(i,j)为r(i)与t(j)之间的距离,则一个映射R和T的总开销D可以表示为D=∑fk=1d(ik,jk)。(3)一个映射也可以描述为在一个2维网格上的一条

文档评论(0)

lnainai_sj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档