动态手势识别技术总结.docVIP

下载本文档

113
0
约3.39千字
约 8页
2018-11-12 发布于福建
举报
版权申诉

动态手势识别技术总结.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

动态手势识别技术总结

动态手势识别技术总结　　摘要：分析比较了现有动态手势识别技术的思路和特点，介绍了基于视觉的动态手势识别基本步骤，分析了该技术路线中存在的若干难点。在此基础上介绍了深度学习方法的基本思路和优点，展望了动态手势识别技术今后的研究方向。　　关键词：手势；动态手势识别；机器学习　　DOIDOI：10.11907/rjdk.151343 　　中图分类号：TP301 文献标识码：A 文章编号文章编号：1672-7800（2015）007-0008-02 　　0 引言　　作为一种不需要中间媒介、非常人性化的人机交互方式，手势是一种理想的自然用户界面（Natural user interface，NUI），它使人们可以用一种更自由的方式与计算机进行交流。　　手势是人手或者手和手臂结合产生的各种姿势或动作，广义上手势还可以包含人的表情、步态等，甚至全身任何部分动作。手势可以分为静态手势和动态手势。静态手势识别考虑某个时间点上手势的外形特征，动态手势关注一段时间内人的一系列动作，增加了时间信息和动作特征。　　本文首先介绍基于视觉的动态手势识别基本步骤，然后分析该技术路线中存在的若干挑战性难点。接着分析比较现有动态手势识别技术的思路和特点，最后总结动态手势识别技术的研究方向。　　1 手势识别基本流程　　一般来说，基于视觉的手势识别基本流程如图 1 所示。设计手势特征和手势模型，并利用手势样本提取特征，对手势模型进行训练，最终建立手势模型。在此基础上，通过视频采集设备获取新的手势视频并进行预处理，接着对手势图像进行手势分割，从而比较准确地提取图像中的人手部分，然后进行手势特征提取；最后，利用前面建立好的手势模型对输入的手势进行分类识别。　　图1 手势识别基本流程　　2 手势识别技术难点　　手势识别是一个非常具有挑战性的研究课题。自然手势存在多样性、多义性等特点，复杂的动态手势必须关注手势时间序列上的变化、手的运动轨迹、手的外形特征等多个方面，这使得基于视觉的手势识别技术面临许多关键问题，手势识别的研究仍然有一些技术难题需要突破。　　首先是手势目标检测与跟踪问题。手势目标检测是手势识别中重要的一步，其好坏直接影响到手势识别效果。环境因素，如复杂多变的背景、不同光照条件等因素的影响，给手势分割带来很大困难；此外，手势在执行过程中可能存在部分遮挡，并且由于手是可变形体，能够做出各种复杂的手势动作，这些都加大了手势分割的难度，目前的手势分割方法还不能完全准确地定位出人手。　　其次是动态手势的时空差异性。人类的手势动作在空间上有很大的灵活性，同类的手势动作，由于不同动作执行者的习惯不同，每次手势轨迹的幅度、方向以及位置都不尽相同，即使是同一人重复做多次，每次的运动速度和幅度都不可能完全一样。另外，从不同角度观察同一手势也会有不同的外观。　　第三就是实时性问题。基于视觉的手势识别系统涉及到大量视频数据的处理，对计算机的运算速度和存储容量要求很高。为了保证较高的识别率，在手势实际识别中，采取的办法是使用多维参数提取手势特征。但参数维度过高会增加处理器的负载，导致计算速度下降。普通用户所使用的计算机处理器性能还不能满足非常复杂的识别算法需要，这使得手势识别很难达到实时性要求。　　3 现有手势识别技术分析　　目前，常用的手势识别方法包括模版匹配法和基于状态转移的图模型方法等。　　模板匹配方法的基本思想是：计算输入手势与已知手势模板之间的相似度来识别手势，是最简单的手势识别方法。具体为：通过手势样本为每种手势训练建立对应的模板。当识别一个新的手势时，首先计算其特征向量，然后与已知模板逐个进行匹配，相似度最高的模板对应的手势类型即为识别结果。一般使用3种函数来衡量输入手势和手势模板特征序列之间的相似度：平方差、相关系数和相关匹配。文献＼[1＼]使用皮肤历史图像进行手势建模，利用 K-means 聚类算法进行训练得到手势模板，通过计算输入手势和手势模板之间的切线距离来衡量二者的相似度。　　模板匹配方法建立和修改比较简单，但当动态手势变得非常复杂时，手势在时间和空间上的差异性，使得每种手势的模板阈值变大，即设定匹配范围较宽。当手势种类较多时，有可能出现一个模板同时与几种手势相匹配的情况，最终导致识别错误。模板匹配方法的识别速度随着手势种类增多而逐渐降低，因此，模板匹配方法不能解决手势的时空差异性问题，无法准确实现实时的多手势识别。　　动态时间规整DTW＼[2＼]是一种时变数据序列匹配方法，其通过在时间轴上调整手势序列以消除动态手势时间上的差异。DTW调整时间轴，将输入手势非线性地映射到模板手势的时间轴上，使得二者之间距离达到最小，然后再进行模板匹配得到最终识别结果。DTW算法优点是数据训