移动设备的语音识别技术.pptVIP

下载本文档

3
0
约4.64千字
约 33页
2021-01-26 发布于天津
举报
版权申诉

移动设备的语音识别技术.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

1 移动设备的语音识别技术（ Speech Recognition techniques for Mobile Devices ） 2 1 3 2 Introduction Architectures of ASR Systems for Mobile Devices Embedded Speech Recognition Systems Network Speech Recognition 4 Distributed Speech Recognition 5 3 Introduction ? 在过去的十年，通信行业获得了空前的发展。据市场研究报告称 2008 年大约销售 12 亿部手机。今天，移动技术已远远超过人与人通信的需求，手机已成为一个移动计算平台。 ? 采用 GPRS 技术的 2.5G 网络，可以提供稳定的 30 - 80Kbps 的分组数据业务。同时，采用 CDMA2000 、 WCDMA 等技术的 3G 网络也正在全球普及，其速度更是高达 384kbps 。 4 Introduction ? 与此同时，基于 IEEE 802.11 协议的无线局域网（ WLAN ）如 Wi-Fi 也得到普遍使用。 Wi-Fi 最高带宽为 11 Mbps ，在信号较弱或有干扰的情况下，带宽可调整为 5.5Mbps 、 2Mbps 和 1Mbps ，带宽的自动调整，有效地保障了网络的稳定性和可靠性。其主要特性为：速度快，可靠性高，在开放性区域，通讯距离可达 305 米，在封闭性区域，通讯距离为 76 米到 122 米，方便与现有的有线以太网络整合，组网的成本更低。 ? 因此，带有无线网卡的计算机或 PDA 设备就可以相互通信。进一步，高达 11Mbps 的通信速度使得基于 IP 的语音和视频会议的应用成为可能。 5 Introduction ? 除了网络技术的迅猛发展以外，客户终端设备也在以同样的速度快速发展。如各大手机厂家生产的智能高端手机，各种先进的 PDA 设备等。 ? 上述这些硬件设备为手持设备支持更多新的数据服务提供了基础。然而，用户接口仍然限制着移动设备的更广泛的应用。手持设备接口的主要问题就是它们的尺寸太小。在如此小的键盘上操作非常不舒服并容易出错。特别是在移动的时候，如驾驶汽车。 6 Introduction ? 很自然地想到解决这个问题的方法就是语音识别技术。语音输入既不需要图形显示也无需与设备直接接触。 ? 在过去的十年里，自动语音识别技术得到极大的重视，基于桌面计算机开发了一系列快速、稳定、有效的语音识别系统。 ? 然而，直接复制桌面应用程序的语音识别算法对性能较低的移动设备来说显然是不合适的。由于移动领域多变的语音环境以及手持设备终端有限的资源，在移动设备上提供语音识别就需要特殊的方法。 7 Introduction ? 移动设备语音识别的三种方式： ? client-based （ Embedded Speech Recognition Systems ）嵌入式语音识别 ? server-based （ Network Speech Recognition ）网络语音识别 ? client-server （ Distributed Speech Recognition ）分布式语音识别 8 1 3 2 Introduction Architectures of ASR Systems for Mobile Devices Embedded Speech Recognition Systems Network Speech Recognition 4 Distributed Speech Recognition 5 9 Architectures of ASR Systems for Mobile Devices ? 语音识别系统本质上是一种多维模式识别系统。它与一般的模式识别系统类似 , 包括语音预处理、语音特征提取、语音模式库和语音模式匹配等基本单元 , 如下图所示 10 Architectures of ASR Systems for Mobile Devices ? 自动语音识别（ ASR ）的基础 ASR 系统的目的就是：给定某一语音观察集 O= （ o 1 ,o 2 , … ,o T ），在固定的词汇库中找到最可能的序列 W= （ w 1 ,w 2 , … ）。根据 Bayesian 理论，单词序列的最大估计可以由下式求得： W * = ? ? ? ? ? ? ? ? O P W P W O P O W P | argmax | argmax W W ? 11 Architectures of ASR Systems