唇读技术的研究其应用.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
唇读技术的研究其应用.pdf

中文摘要 人类的语言认知过程是一个多通道的感知过程。除声音信息通道外,屠动视 觉信息可以作为一种重要的语音理解源。视觉语言具有许多潜在的应用,因此通 过机器的自动唇语识别即唇读技术近年来成为一个备受关注的研究领域。大多数 研究者的目的是把唇语识别和语音识别相融合,以提高语音识别的正确率。不同 于这些研究,本文研究的目的是把唇读技术应用于语言残疾者的康复工程中,最 终设计一个视觉语言驱动的实时语音合成系统。因此,本文主要研究了屠读中的 一些关键技术并实现了一个基于孤立词识别的唇读系统。 本文首先介绍了目前唇读研究的现状与发展水平,详细阐述了唇读研究的内 容和方法,以及唇读研究的意义。在此基础上,提出了本文的唇读系统实现方案, 该系统主要包括视觉前端、视觉特征提取单元和唇语识别理解单元三部分。 视觉前端主要是把人说话时的唇动序列图像实时送入计算机,并对唇进行定 位和跟踪。因此本文设计了一个基于USB的图像采集系统,该系统采用专门的 视频处理芯片对模拟视频信号进行处理,然后采用CPLD、DSP和USB技术实 现对数字视频信号的采集和传输。该系统设计合理,易于实现,同时具有连接方 便,即插即用等优点。 视觉特征提取单元首先采用一种唇色滤波器对图像进行预处理,增强了唇 色,然后采用主动轮廓模型算法实现口型轮廓的提取和跟踪。文中采用了一种改 进的主动轮廓模型算法,该算法引入作用方向可以自适应变化的外加强制力,使 控制点能够不依赖于初始轮廓而快速收敛到目标的真实轮廓,且初始轮廓自动确 定,控制点的数目可以自适应地改变。该主动轮廓模型算法可以实现对唇型轮廓 的快速提取。 唇语识别和理解单元是利用视觉特征提取单元提供的口型特征参数,采用隐 马尔可夫模型(HMM)训练和识别图像序列的发音类。HMM过程是一个双重 的随机过程,这与人类语言的唇动过程是相吻合的。为提高系统识别的正确率, 系统设计中采用了连续型隐马尔可夫模型。文中详细讨论了在使用HMM中的模 型初始化、参数训练和识别问题并给如了实验结果。 本文设计的唇读系统在对特定人5个孤立词的实验中,可以达到6l%的识 别率。论文最后对全文进行了总结并对唇读技术的发展进行了展望。 关键词:唇读,图像采集,USB,主动轮廓模型,隐马尔可夫模型 ABSTRACT Human is amultimodal information speechperceptioninherently process.Visual inthe mouth isalsoan informationsource speaker’s region importantspeech except for acousticsource.Visualhas andhas signal manypotential speech applications in motivated interestautomatic ofvisual significant recognition speech,formally knownasautomatic workofthisarea lipreading,orspeechreading.Thepast mainly focuseson withautomatic to integratingspeechreading speechrecognitionimprove recognition this areinterestedin speech

文档评论(0)

chengben002424 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档