基于词组语音识别模型研究.docVIP

  • 3
  • 0
  • 约2.9千字
  • 约 7页
  • 2018-08-30 发布于福建
  • 举报
基于词组语音识别模型研究

基于词组语音识别模型研究   摘要:本文在简单介绍三种词组语音识别模型后,提出了采用离散隐马尔柯夫模型(DHMM)来构建语音识别系统,并在此基础上引入矢量量化(VQ)模块来保证识别率和识别速度,具有良好的实用性。   关键词:矢量量化模块;语音识别;隐马尔柯夫模型   中图分类号:TP391.42 文献标识码:A文章编号:1007-9599 (2011) 14-0000-01   Phrase-Based Speech Recognition Model Study   Chen Fengliang,Peng Shengze   (Mianyang Teachers College,Mianyang621000,China)   Abstract:This paper describes three kinds of phrases in a simple speech recognition model,the paper introduces the discrete hidden Markov model(DHMM)to build speech recognition systems,and on this basis,the introduction of vector quantization(VQ)module to ensure that the recognition rate and recognition speed,with good usability.   Keywords:Vector quantization module;Speech recognition;Hidden Markov model   一、语音识别模型概述   (一)人工神经网络模型。人工神经网络模型的本质是利用大量简单的处理单元进行相互的交叉连接,从而构建出一种较为复杂的信息处理系统。该模型特点是模拟了人类神经元的活动方式,因而具有自学以及推理能力,同时还具有高并行处理能力和容错能力。但该模型数据计算量庞大,模板训练和语音识别算法的实现过程较为复杂,且识别贡献率相比其他模型而言并不具有优势。(二)隐马尔柯夫模型。隐马尔柯夫模型是一种描述语音信号动态变化并具有动态时间规整能力的统计模型,是一种双重随机过程,对准平稳事变信号能够进行有利的分析。该模型具有高准确率的描述语音信号特征能力。其缺点是数据计算量相对较大。(三)动态时间规整。动态时间规整是一种动态规划思想,它利用局部的最佳化原则来搜寻出一条自动的最佳路径,从而使得两个特征参数矢量间的失真度最小。动态时间规整采用时间校准特征参数序列,可有效解决语音信号在时间上的对不准问题。其缺点是仅对特定人的语音识别具有较理想的识别效果,并且需要对关键词组所涉及的可能所用样本进行训练,否则识别效果将降低。   以上三种模型都存在各自局限性,但综合比较而言,隐马尔柯夫模型具有较高的综合性能。本文提出采用离散隐马尔柯夫模型(Discrete Hidden Markow Model,DHMM)来构建语音识别系统,并在此基础上引入矢量量化(Vector Quantization,VQ)模块来保证识别率和识别速度。   二、基于DHMM和VQ的语音识别系统的总体结构   针对连续隐马尔柯夫模型(CHMM)计算量大并且难以用硬件电路来描述实现的缺点,本文提出的基于DHMM和VQ的语音识别系统在端点检测、特征提出等几个方面进行改进,以减少计算量并提高识别率。基于DHMM和VQ的语音识别系统的总体结构如图1所示:         训练      模板参考      识别判定         图1:基于DHMM和VQ的语音识别系统的总体结构   (一)状态机法端点检测。传统的双门限法检测不易于采用硬件电路实现,并且难以对对语音信号进行实时的端点检测。本文所提出的状态机法端点检测方法能够解决双门限法检测的缺陷,适合对语音信号进行实时的检测,并且能用硬件电路来实现。状态机法端点检测的本质就是将能量状态以及过零率状态变迁过程中每帧信号装变成状态值,然后根据这些状态值的逻辑关系来完成端点检测。该检测方法具有计算量小、存储空间小的特点。(二)MFCC特征提取。MFCC模拟了人耳听觉感知方面以及人耳对语音的响应特征,更加符合人类的真实听觉特性。同时,MFCC在噪声环境下能够表现出良好的识别性能以及鲁棒性,并不依赖于全极点模型假定。因此,在非特定人语音识别中能够有效减少不同说话人的口音、方言带来的干扰,能够提高识别性能。(三)离散隐马尔柯夫模型。传统的CHMM模型具有计算量大、存储量大的缺点,导致难以用硬件电路来描述。针对这一现象,本文所提出的离散隐马尔柯夫模型参数B为离

文档评论(0)

1亿VIP精品文档

相关文档