移动设备的语音识别技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1 移动设备的语音识别技术 ( Speech Recognition techniques for Mobile Devices ) 2 1 3 2 Introduction Architectures of ASR Systems for Mobile Devices Embedded Speech Recognition Systems Network Speech Recognition 4 Distributed Speech Recognition 5 3 Introduction ? 在过去的十年,通信行业获得了空前的发展。据市 场研究报告称 2008 年大约销售 12 亿部手机。今天 ,移动技术已远远超过人与人通信的需求,手机已 成为一个移动计算平台。 ? 采用 GPRS 技术的 2.5G 网络,可以提供稳定的 30 - 80Kbps 的分组数据业务。同时,采用 CDMA2000 、 WCDMA 等技术的 3G 网络也正在全球普及,其 速度更是高达 384kbps 。 4 Introduction ? 与此同时,基于 IEEE 802.11 协议的无线局域网( WLAN )如 Wi-Fi 也得到普遍使用。 Wi-Fi 最高带宽为 11 Mbps ,在信号较弱或有干扰的情况下,带宽可调整 为 5.5Mbps 、 2Mbps 和 1Mbps ,带宽的自动调整,有 效地保障了网络的稳定性和可靠性。其主要特性为:速 度快,可靠性高,在开放性区域,通讯距离可达 305 米 ,在封闭性区域,通讯距离为 76 米到 122 米,方便与现 有的有线以太网络整合,组网的成本更低。 ? 因此,带有无线网卡的计算机或 PDA 设备就可以相互通 信。进一步,高达 11Mbps 的通信速度使得基于 IP 的语 音和视频会议的应用成为可能。 5 Introduction ? 除了网络技术的迅猛发展以外,客户终端设备也在以同 样的速度快速发展。如各大手机厂家生产的智能高端手 机,各种先进的 PDA 设备等。 ? 上述这些硬件设备为手持设备支持更多新的数据服务提 供了基础。然而,用户接口仍然限制着移动设备的更广 泛的应用。手持设备接口的主要问题就是它们的尺寸太 小。在如此小的键盘上操作非常不舒服并容易出错。特 别是在移动的时候,如驾驶汽车。 6 Introduction ? 很自然地想到解决这个问题的方法就是语音识别技术。 语音输入既不需要图形显示也无需与设备直接接触。 ? 在过去的十年里,自动语音识别技术得到极大的重视, 基于桌面计算机开发了一系列快速、稳定、有效的语音 识别系统。 ? 然而,直接复制桌面应用程序的语音识别算法对性能较 低的移动设备来说显然是不合适的。由于移动领域多变 的语音环境以及手持设备终端有限的资源,在移动设备 上提供语音识别就需要特殊的方法。 7 Introduction ? 移动设备语音识别的三种方式: ? client-based ( Embedded Speech Recognition Systems )嵌入式语音识别 ? server-based ( Network Speech Recognition )网络 语音识别 ? client-server ( Distributed Speech Recognition )分 布式语音识别 8 1 3 2 Introduction Architectures of ASR Systems for Mobile Devices Embedded Speech Recognition Systems Network Speech Recognition 4 Distributed Speech Recognition 5 9 Architectures of ASR Systems for Mobile Devices ? 语音识别系统本质上是一种多维模式识别系统。它与一般 的模式识别系统类似 , 包括语音预处理、语音特征提取、 语音模式库和语音模式匹配等基本单元 , 如下图所示 10 Architectures of ASR Systems for Mobile Devices ? 自动语音识别( ASR )的基础 ASR 系统的目的就是:给定某一语音观察集 O= ( o 1 ,o 2 , … ,o T ),在固定的词汇库中找到最可能的序列 W= ( w 1 ,w 2 , … )。根据 Bayesian 理论,单词序列的最大估 计可以由下式求得: W * = ? ? ? ? ? ? ? ? O P W P W O P O W P | argmax | argmax W W ? 11 Architectures of ASR Systems

文档评论(0)

jinzhuang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档