- 8
- 0
- 约6.09千字
- 约 65页
- 2018-11-09 发布于江苏
- 举报
基于神经网络的音识别技术研究
1 语音识别基础 目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分: (a)语音特征提取:目的是从语音波形中提取随时间 变化的语音特征序列。 (b)声学模型与模式匹配(识别算法):声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学模型通常由获取的语音特征通过训练产生,目的是为每个发音建立发音模板。在识别时将未知的语音特征同声学模型(模式)进行匹配与比较,计算未知语音的特征矢量序列和每个发音模板之间的距离。 声学模型的设计和语言发音特点密切相关。声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大 影响。 (c)语义理解:计算机对识别结果进行语法、语义分析。明白语言的意义以便做出相应的反应,通常是通过语言模型来实现。 1.1 语音识别面临的问题 。 1.2 本文的主要工作 本文的主要工作是对现有的语音识别算法进行改进和验证,在前人研究的基础上,研究了语音信号参数的提取方法和常用识别算法,重点研究了HMM在语音识别中的应用,包括模型的原理,模型的建立、训练和识别等过程,对HMM模型的原理和核心算法和实际应用中的问题进行了深入的研究,提出了基于HM
原创力文档

文档评论(0)