语音识别输入系统设计..doc

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音识别输入系统设计.

目 录 目 录 1 第一章 语音识别简介 3 1.1 语音识别的研究历史及现状 3 1.2 语音识别系统的分类 4 1.3 语音识别系统的基本原理 4 1.4 语音识别的基本构成 5 1.5 语音识别的几种基本方法 5 1.5.3 改进的HMM-DDBHMM 6 1.5.4 人工神经元网络(ANN) 7 1.6 语音识别技术面临的技术难点及对策 7 第二章 语音信号的预处理 8 2.1 概述 8 2.2 分帧 10 2.3 预加重 11 2.4 加窗 12 2.4.1 窗函数的定义 12 2.4.2 窗函数的三种主要类型 12 2.4.3 窗函数的选择 13 第三章 端点检测 14 3.1 端点检测概述 14 3.2 短时能量 15 3.3 短时过零率 15 3.4 双门限端点检测 16 3.5 程序实现 17 3.5.1 计算短时过零率 17 3.5.2 计算短时能量 17 3.5.3 端点的截取 18 第四章 语音识别参数提取 22 4.1 LPC和LPCC系数 22 4.1.1 lpc及lpcc系数的简介 22 4.1.2 lpc系数的基本计算原理 23 4.2 MFCC系数 24 第五章 DTW算法实现 27 5.1 模式的匹配 27 5.2 DTW算法原理 28 5.3 DTW算法改进 30 5.3.1搜索宽度限制 30 5.3.2放宽端点限制 30 第六章 matlab编程结果 32 6.1 实验程序文件 32 6.2 语音识别仿真结果 32 结 论 34 致 谢 35 参考文献 36 附 录 37 1.DTW程序 37 2.DTWTEST程序 40 3.MFCC程序 41 4.TRAIN程序 43 5.VAD程序 44 6.ENFRAME函数程序 49 引言 语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴。其研究目标是让计算机听懂人类口述的语言这是人类自计算机诞生以来梦寐以求的想法。随着计算机软硬件和信息技术的飞速发展,这种想法更加明显,人们越来越迫切要求摆脱键盘的束缚而代之以语音输入这样便于使用的、自然的、人性化的输入方式。 语音识别起源于20世纪50年代AT&T贝尔实验室的Audry 系统, 它第一次实现了10 个英文数字的语音识别,这是语音识别研究工作的开端。60 年代,计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划和线性预测分析技术(LP),其中后者较好地解决了语音信号产生模型的问题,对语音识别的发展产生了深远影响。70 年代,语音识别领域取得了突破。LP 技术得到进一步发展,动态时间归正技术(DTW)基本成熟,特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论, 并实现了基于线性预测倒谱和DTW 技术的特定人孤立语音识别系统。80 年代,实验室语音识别研究产生了巨大突破,一方面各种连接词语音识别算法被开发,例如多级动态规划语音识别算法;另一方面语音识别算法从模板匹配技术转向基于统计模型技术,研究从微观转向宏观,从统计的角度来建立最佳的语音识别系统。进入90 年代以后, 人工神经网络技术的应用成为语音识别的一条新途径, 它具有自适应性、并行性、非线性、鲁棒性、容错性和学习特性,在结构和算法上都显示出了很大的潜力,而且还在细化模型的设计、参数提取和优化,以及系统的自适应技术上取得了关键进展。语音识别技术进一步成熟,语音识别系统从实验室走向实用。 语音识别技术是非常重要的人机交互技术,应用语音的自动理解和翻译,可消除人类相互交往的语言障碍。国外已有多种基于语音识别产品如声控拨号电话、语音记事本等已经应用,基于特定任务和环境的听写机也已经进入应用阶段,这预示着语音识别技术有着非常广泛的应用领域和市场前景。随着语音技术的进步和通信技术的飞速发展,语音识别技术将为网上会议、商业管理、医药卫生、教育培训等各个领域带来极大的便利。 第一章 语音识别简介 1.1 语音识别的研究历史及现状 语音识别的研究工作始于20世纪50年代,1952年Bell实验室开发的Audry系统是第一个可以识别10个英文数字的语音识别系统。1959 年,Rorgie和Forge采用数字计算机识别英文元音和孤立词,从此开始了计算机语音识别。60年代,苏联的Matin等提出了语音结束点的端点检测,使语音识别水平明显上升;Vintsyuk提出了动态编程,这一提法在以后的识别中不可或缺。60年代末、70年代初的重要成果是提出了信号线性预测编码(LPC)技术和动态时间规整(DTW)技术,有效地解决了语音信号的特征提取和不等长语音匹配问题同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。 80年

文档评论(0)

sa1fs5g1xc1I + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档