一种基于改进DTWIMP算法手势识别.docVIP

下载本文档

11
0
约3.55千字
约 8页
2018-08-13 发布于福建
举报
版权申诉

一种基于改进DTWIMP算法手势识别.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种基于改进DTWIMP算法手势识别

一种基于改进DTWIMP算法的手势识别　　摘要：手势识别是一种多维空间应用，而传统DTW算法只能解决一维问题，对其进行拓展，演化为不同维度运用，得到一种全新基于改进的新型算法DTWIMP，它能计算两个N维时间序列之间的距离。以欧氏距离为元素组成矩阵，根据Bellman最优化原理得到最优规整路径，结合预先录入的手势模版，实现动态手势识别。　　关键词关键词：DTW；DTWIMP；欧氏距离；Bellman最优化；手势识别　　DOIDOI：10.11907/rjdk.171904 　　中图分类号：TP3-0 　　文献标识码：A文章编号文章编号2017）011001204 　　0引言　　计算机视觉技术飞速发展，人机交互技术（Human Computer Interaction，HCI）显得愈发重要。人机交互最终目标是人与计算机能以更直观、自然的方式进行交流，所谓自然交互方式是指将人与人交流的手段引入HCI。对此国内外学者开展了大量研究，包括人脸与人体识别、面部表情、体态交互技术研究。手势作为人机交互领域重要一环，具有直观性、自然性特点，在交互式游戏、家电控制、手语识别、模拟训练及机器人控制领域得到了广泛应用。　　使用传感器（深度摄像机或LeapMotion）捕获手势运动轨迹[1]。对于静态手势只需关心空间中手的位置与形状；对于动态手势实质上需识别手势轨迹，重点在于如何准确在手势时间序列上检测到手势起始点与终止点，规避手势交互中回程问题。本文对一维DTW加以拓展与改进，通过实验验证其在动态手势识别中的重要作用。　　1DTW算法分析与改进　　动态时间规整（Dynamic Time Warping，DTW）算法是一种动态规划技术，对非线性时间归一化后进行模式匹配[2]。该算法是种弹性匹配算法，用以解决两个时间序列在时间轴上长度不规整问题。　　DTW算法可实现对于不同长度时间序列相似性的判断，传统DTW算法都是针对一维特征输入情况，由于手势输入特征是多维的，需要能够计算2个N维时间序列之间距离的算法，为此本文提出基于改进的DTWIMP算法，原理如下：　　假定有两个不同时间序列X={x1，x2，…，xx}T与Y={y1，y2，…，yy}T，其中xi，yj是N维的向量，该时间序列长度分别为X与Y，构造规整路径Z={z1，z2，…，zz}T。因此规整路径序列Z的长度定义如下：　　3实验分析验证　　3.1模板相似度分析　　获取模板距离后，可根据相似度公式分别计算出当前输入序列与各手势模板之间相似度（见图6）。横轴代表手势模板类型，不同线型代表当前输入序列与模板相似度。以手势O为例，定义输入序列与模板序列之间相似度为Likehoods，可得输入序列与手势模板O之间相似度最大，Likehoodsmax=0.365，而该输入序列与其他模板手势相似度明显低于该值，表明该输入序列最可能的分类标签是手势O。其余手势相似度曲线可由类似分析得到结论。　　图6测试序列与参考模板相似度　　3.2模型平均正确分类比率分析　　评估DTWIMP算法对应不同训练样本的分类性能，对于MCI系统而言极其重要，因为如果使用3组训练样本与使用30组样本能达到同样分类性能，则数据采集及训练阶段将会节省大量时间。　　ACCR（Average Correct Classification Ratio）代表平均分类正确率，为了验证每种手势样本训练数据集大小对DTWIMP算法分类性能影响（如3组样本训练集得到分类器性能与20组样本训练集得到分类器性能肯定不同）。设计如下实验：选取10名参与者，对同一种手势分别进行η（3≤η≤20）次样本数据实验，因估计模板阈值至少需要3组训练样本，所以最小取值3而非1。为避免选取实验样本出现“极好”情况（随机挑选训练数据得到最好模板），η的取值应重复10次，分别记录每一次ACCR值，尽量保证训练样本质量在同一水平，记录ACCR平均值来验证算法性能（见图7）。　　图7分类正确率与样本数量关系　　从上述数据可以看出，DTWIMP算法在训练集大小为3时，ACCR达到了74.55%正确率，在训练集大小为20时，达到了94.18%的正确率。ACCR总体趋势是大小与训练集样本数量呈正比趋势，训练集大小达到12时，ACCR值超过90%（虚线）；训练集大小超过12后，ACCR提升并不明显。　　实验发现，η的每次重复实验中，10名参与者标准偏差非常大，这表明DTWIMP分类性能很大程度取决于训练样本质量，例如某些参与者使用3组样本数据得到了ACCR值大于90%的结果，而另一些参与者使用3组不同质量样本集却得到了ACCR值小于70%的结果。说明样本集质量好坏对于分类算法结果具有重要