语音识别技术中的特征参数及声调识别的分析-analysis of characteristic parameters and tone recognition in speech recognition technology.docxVIP

下载本文档

12
0
约5.17万字
约 76页
2018-06-05 发布于上海
举报

语音识别技术中的特征参数及声调识别的分析-analysis of characteristic parameters and tone recognition in speech recognition technology.docx

语音识别技术中的特征参数及声调识别的分析-analysis of characteristic parameters and tone recognition in speech recognition technology

I I 语音识别技术中的特征参数及声调识别的研究摘要语音特征参数的选择与提取是语音识别中的一个基本问题准确地提取语音特征参数并以合适的方式在语音识别系统中表达出来是达到良好识别结果的基础共振峰是语音的一个基本特征参数从已有共振峰提取算法的缺陷出发本文提出了一种新的基于逆滤波器原理的方法来识别共振峰参数采用一组逆滤波器来逼近语音信号的短时能谱通过动态搜索算法得到滤波器组中各个滤波器的位置与带宽从而确定共振峰的位置和带宽根据共振峰的连续性等特点提出了优化动态搜索算法大大提高了运算速度本文讨论了共振峰参数在语音识别中的应用把所提取出的共振峰及其带宽作为特征参数用于一个小词汇量的汉语语音识别系统中实验表明其识别正确率达到了 98% 把共振峰参数作为动态特性应用到动态 HMM 模型中使一个大词汇量中文语音识别系统的错误率下降了近 10% 基音周期是语音的另一个基本特征基音提取是语音信号处理中一个重要的课题在语音压缩编码语音识别尤其是汉语语音识别中有着重要意义人们已经提出了多种基音提取方法然而各种方法一般都有其固有的局限性难以在各种情况下都保持较好的性能针对这种情况本文提出了一种综合的算法综合运用了平均幅度差法自相关函数法和简单逆滤波器跟踪法等多种算法对候选的基音频率点进行打分最后再用动态搜索的算法找出一条全局最优路径从而避免了单一方法的局限性取得了很好的性能本文还讨论了基音参数在语音识别中的应用通过两种方法在语音识别系统中应用基音参数一种是通过把基音参数加入到识别参量中去直接在 HMM 模型中应用在汉语连续数字串汉语小词汇量 I II 的短语集以及汉语大词汇量连续语音三种情况下对该方法进行了测试实验结果表明系统识别率获得了一致的提高提高的幅度超过 10% 这种直接应用基音参数的方法实现起来简单统一可以在任何带调语音识别系统中进行应用另一种方法是通过基于规则的方法应用基音参数在汉语连续数字串的语音识别系统中根据声调基音包络的不同设计一组规则来对不同的基音包络曲线进行区分从而达到区分易混淆数字对的目的这种方法在识别率的提高上比第一种方法的性能要好但只能应用于某些特定的语音识别系统并且须针对该系统设计规则不具有通用性汉语有五个基本的声调它靠特征参数中的基音包络来表达声调识别在汉语语音识别中有着重要意义它能帮助准确地识别出汉语音节以及简化识别系统中后端的语法模型从实用性稳健性出发本文建立了两个针对大词汇量中文连续语音的声调识别系统一个基于隐马尔科夫模型另一个基于人工神经网络方法本文详细讨论了这两个系统的系统结构特征提取音节切分模型设置等问题并结合声调的特点考虑了上下文相关的模型使声调识别系统的性能达到了最优对比隐马尔科夫模型和人工神经网络两个声调识别系统可以看到基于人工神经网络的方法识别性能要稍优于基于隐马尔科夫模型的方法但是基于神经网络的系统要求有个额外的音节切分步骤并且系统的识别率在很大程度上依赖于该音节切分算法的准确性关键词语音识别特征提取共振峰基音周期声调识别 PAGE PAGE IV STUDY ON ACOUST IC FEATURES AND TONE R E C O G N IT ION OF SPEECH RECOGN IT IO N ABSTRACT Feature Extraction and Selection is fundamental in speech recognition. Extracting features precisely and presenting them appropriately in a speech recognition system is elemental to gain good performance. Formant is a basic feature of speech. Because of the limitation of present formant extraction algorithm, a method based on inverse filter is proposed to extract the formant parameters. A bank of inverse filters is used to approach the Short Time Fourier Transform of speech signal. The dynamic programming algorit

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

语音识别技术中的特征参数及声调识别的分析-analysis of characteristic parameters and tone recognition in speech recognition technology.docxVIP