- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
虚拟立体视约束的视角无关手语识别研究
摘要
手语识别研究致力于通过计算机将手语翻译成文字或者语音,以方便聋人与健听人之间
的交流和帮助聋人更好地融入社会。
依手语数据获取方式的不同,手语识别研究通常分为基于数据手套的手语识别和基于视
觉的手语识别两个类别。二者当中,基于视觉的手语识别研究,由于应用起来更为方便和自
然,备受研究者所关注。然而,大多数基于视觉的手语识别研究限定摄像机的捕获视角,通
常限定为正面视角。限定捕获视角意味着手语者只能在特定的空间以特定的朝向执行手语,
这严重地限制着手语者的自由。
本文针对单摄像机应用中、一定范围内视角无关的手语识别,也即观测手语样本的捕获
视角在一定范围内任意且未知情况下的手语识别进行研究,以在一定程度上解除对摄像机捕
获视角的限定,从而方便用户的使用。这里的一定范围,是指摄像机的光轴方向与手语者正
面朝向之间的角度限制在45˚范围之内。数据规模初步定于中等词汇集。
重点研究如下两方面内容:
一是基于视角相关特征的视角无关手语识别研究。基于虚拟立体视约束,即“同一手语
不同捕获视角下的两个样本,对齐之后可解释为由某一虚拟的立体视觉系统同步捕获的一个
样本对”,本文提出一种新颖的、使用视角相关特征的视角无关手语识别框架。此框架将两
个手语序列的匹配问题转化为极几何中的一个验证问题,通过验证“两个手语序列是否能被
解释为由某一虚拟立体视觉系统同步捕获的一个样本对” 来完成识别。由于是直接基于特
征点的图像坐标进行识别,此框架提供了一种使用视角相关特征而实现视角无关手语识别的
可能性。基于此框架,本文提出了三种具体的使用视角相关特征的视角无关手语识别方法,
分别是基于基础矩阵唯一性的视角无关手语识别方法、基于证据理论的验证基础矩阵唯一性
的视角无关手语识别方法以及基于复合帧对应的视角无关手语识别方法。实验显示了这些方
法的有效性。
二是短时数据缺失下稳定而有效的视角无关手语识别方法研究。所谓数据缺失,是指手
语样本中某些时刻只能提供很少的有用特征以供匹配之用或者不能提供任何有用特征的情
况。很多因素都能导致数据缺失的出现,比如自遮挡、成像因素导致的图像模糊、以及特征
提取算法的不完善等因素。除此之外,在视角无关的手语识别中,同一手语不同捕获视角的
样本之间可视特征的不尽一致,也能够导致数据缺失的出现。数据缺失影响识别算法的有效
性和可行性。本文针对短时数据缺失下稳定而有效的视角无关手语识别方法进行重点研究,
提出了基于运动元顺序出现单应性的视角无关手语识别方法以及基于基础矩阵的局部采样
(Sample )加全局验证(Consensus )的视角无关手语识别方法。这两种方法基于多帧图像
来进行序列匹配的考察,由于多帧图像可以提供更多的有用特征,这两种方法能够有效地处
理短时数据缺失情况。实验显示了这两种方法的有效性。
值得指出的是,本文提出的基于虚拟立体视约束的视角无关识别框架和因之而提出的各
种视角无关识别方法不仅仅适用于手语识别,还能应用到更为广泛的领域,比如视角无关的
动作识别和刚体运动分析等。
Abstract
Sign language recognition aims to translate sign language into text or speech by computer, so
as to facilitate the communication between the deaf and the hearing people and help the deaf or
hard-of-hearing better integrate into the society.
According to data collection of sign language, sign language recognition are generally
divided into two major categories: dataglove-based sign language recognition and vision-based
sign language recognition. Since the vision-based method is more convenient to the e
文档评论(0)