基于立体视觉的自然手势识别.pdfVIP

下载本文档

5
0
约1.39万字
约 7页
2017-03-18 发布于广东
举报
版权申诉

基于立体视觉的自然手势识别.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于立体视觉的自然手势识别.pdf

基于立体视觉的自然手势识别张凯葛文兵汪国平董士海北京火学信息科学技术学院人机交互与多媒体实验室，北京，10087 摘要：本文提出了一种基于立体视觉的自然手势识别方法。本文方法有如下特点：(t)无穿 f 戴自然手势交互，在满足平面近似的奈件下，可任意扩充手势语义i ii)模板库小，仅仅需要存储每种手势的正面图像，使于高效匹配；(iii)提出了一种新的立体匹配算法，将手势的视差图简化为平面，用以快速获取手势和手臂的三维信息：(iv)可自动调整相机位置，得到手势的正西图像，用于模板匹配。实验结果表明，本文算法对各种朝向的手势都有着良好的支持，识别率高，强壮性好。关键词：手势识别；立体匹配视差 1．引言在自然交互领域，手势识别一直都是研究的热点。作为一种通用的基础算法，手势识别广泛应爿j于交互游戏、三维设计，机器人研究等多个领域。利用数据手套，人俐可以获得精确的手势数据”J。但是，这类方法在交互上不自然的缺点是显而易见的，因此，在对精度要求并不十分严格的情况下，无穿戴的视觉方法更受青睐，这也是现在手势识别技术的主要研究方向。目前，手势识别算法分为两大类：基于模型的识别和基于列像的识别。基丁二模型的方法利用多相机重建手势的三维信息，将重建后的体数据与给定的三维模型相匹配。这类算法精度高，但是计算代价昂贵，且稳定性差”。1。基于图像的方法利用多个角度的手势图像作为模板，并插值生成模板库中没有的手势图像。由于无法控制手势的朝向，这类算法往往需要庞大冗余的模板库，为手势匹配增加了不必要的开销，当光线条件不理想刚，也筚≠易得到错误的匹配旷…。在计算机视觉领域，立体匹配在近十年来也一直都是研究的热点问题。给定一对水平校准的立体图像，对场景中任一空间点JP，考虑其在左右图中的映像P和口。因为图像是校准的，山对极几何可知，P和q都在同一条水平扫描线上，它们之间的位置差值称为视筹(disparity)。立体匹配以立体图像中的某一幅图(通常是左图)为参考图，确定每一点的视差及遮挡关系，并得到场景视差刚(disparitymap)。由几何关系町推知，视差和景物深度成反比”…“J，求得视差之后，可以很方便的得到物体的深度信息，并重建三维模型。基于Graph—cut和信度扩散(beliefpropagation)的立体匹配算法可以达到相当高的精度Ljl”J，但这类算泫效率1；高，不适合实时交互的需要。本文结合前述两类手势识别技术的优点，利用立体视觉的方法求得于势的正面图像， No No 资助项日·型家蓖点基础研究笈展训l 2004CB719403、围家高技术研究茬展计划项H2004AAll5120、自然科学基金项口N Dkuedu廿1 联系作者：张凯，E-mail：zk@graphics Ⅲ交互系统 521 然后与预定义的模板进行匹配，从而确定语义。本文算法基于砖个假设。第一个是关于手势的“平面性假设”。我们注意到，由于手部纹理的近似性，我们可以安全的忽略手势的自遮挡现象，将手势的视差图简化为平面。实际上，这一个假设对于大多数手势都是满足的。第二个假设是手势和手臂的“共面假设”，即假定在手势运动过程中，手势和手臂基本处于同一个平面。如果我们能得到手势平面的参数和手臂的朝向信息，就能对相机位置进行刚体变换，求得手势的正面图像。本文的后续部分如下组织：第二节介绍算法的预处理过程；第三、四节是本文的重点部分，首先介绍以场景平面模拟手势的立体匹配算法，然后依据得到的手势和手臂的三维信息，调整相机位置，求得手势正面图像，进行语义判定；最后讨论实验结果并进行小结。 2．预处理算法的预处理过程包括三部分。首先，我们需要定义不同的手势，用以表达不同的语义。我们对每个手势正面拍照，使相机主平面与手掌平面平行，相机主平面的y轴方向和手臂方向平行，相机光心与手势质心的连线与相机主轴重合。对每一个手势照片，求得其外接矩形，并将此矩形缩放至一定大小(譬如，64x