第5章 语音识别技术(幻灯片讲义).pdf

  1. 1、本文档共85页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章 语音识别技术(幻灯片讲义)

第五章 语音识别技术 1. 绪论 1.1. 意义 人机通讯的基础。这句话点明了语音识别的重大意义。 1.2. 应用 查询、控制、通信三个方面。 1 1.3. 历史 语音识别技术的研究始于 50 年代。那时候的研究工作基本 上还是比较简单的,人们只能利用一些简单的硬件设备,例如 模拟滤波器、X 光机等,对语音识别作一些初步的研究,取得 了如语谱图、小此词汇量孤立字数字语音识别系统等一些成果。 1952 年,Bell 实验室的 Davis, Buiddulph 和 Balashek 等人研制 出世界上第一台原始的语音识别系统即Audry System 。这个系 统只能识别一个人的孤立数字发音。系统采用测量数字中元音 部分的频谱共振峰的方法来识别数字。 在 60 年代,开始出现了一些有关语音识别的理论和方法。 2 例如,在语音学方面,瑞典通信工程师 Fant 发表了著名的博士 论文《语音产生的声学理论》。进入 60 年代中后期,计算机已 经开始得到迅速的发展,为计算机从军用转向民用提供了可能。 同时数字信号处理的理论和算法,例如快速傅立叶、倒谱计算、 线性预测算法、数字滤波器等,在这时候也取得了飞跃的发展, 因而自从 60 年代末期引发了语音识别的热潮。 3 在 70 年代,孤立字语音识别技术开始成为了一个实用的技 术。日本学者Sakoe 和 Chiba 将动态规划的概念用于解决孤立 词识别时说化速度不均匀的难题,提出了著名的动态时间伸缩 算法,即 DTW 算法(Dynamic Time Warping )。这种算法在应 用于较小的词汇表时取得了很大的成功。Itakura 还将用于低速 语音编码的线性预测编码(Linear Prediction Coding, LPC )技术 推广应用于语音识别,提出了 Itakura 距离,基于 LPC 预测系 数的语音特征被成功地应用于语音识别。 4 在 80 年代,研究重点转向了连结词语音识别和连续语音识 别。这期间语音识别技术研究中最重要的一件大事就是诞生了 语音识别的 HMM 模型和方法,发表了一系列关于语音识别 HMM 方法的理论。从此语音识别从模板匹配的方法转向了基 于统计的模型的方法。 90 年代以来,语音识别研究的主要方向是非特定人、大词 汇量、连续语音识别系统,出现了高水平的语音识别系统。 现状,……。 5 1.4. 语音识别的难点 1 )人类对语音知识的无知; 2 ) 语音信号的时变性和随机性。 1.5. 语音识别技术的分类 根据识别的目的及重点不同,语音识别技术可以分为几类: 1)按说话人的对象分: 特定人(Speaker Dependent )、 多个指定人 非特定人(Speaker Independent) 6 2 )按语音的发音方式分: 孤立字(词):Isolated Word 连接词: Connected Word 连续语音: Continuous Speech 3 )按识别的词汇表大小分: 小词汇表: 小于 100 中等词汇表: 100~500 大词汇表: 大于 500 4 )说话人识别:Speaker Identification 5 )关键词识别:Keyword Spotting 7 1.6. 语音识别中的模板匹配方法

您可能关注的文档

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档