语音识别技术中的特征参数及声调识别的分析-analysis of characteristic parameters and tone recognition in speech recognition technology.docxVIP

  • 12
  • 0
  • 约5.17万字
  • 约 76页
  • 2018-06-05 发布于上海
  • 举报

语音识别技术中的特征参数及声调识别的分析-analysis of characteristic parameters and tone recognition in speech recognition technology.docx

语音识别技术中的特征参数及声调识别的分析-analysis of characteristic parameters and tone recognition in speech recognition technology

I I 语音识别技术中的特征参数及声调识别的研究 摘要 语音特征参数的选择与提取是语音识别中的一个基本问题 准确 地提取语音特征参数并以合适的方式在语音识别系统中表达出来 是达到良好识别结果的基础 共振峰是语音的一个基本特征参数 从已有共振峰提取算法的缺陷 出发 本文提出了一种新的基于逆滤波器原理的方法来识别共振峰 参数 采用一组逆滤波器来逼近语音信号的短时能谱 通过动态搜 索算法得到滤波器组中各个滤波器的位置与带宽 从而确定共振峰 的位置和带宽 根据共振峰的连续性等特点 提出了优化动态搜索 算法 大大提高了运算速度 本文讨论了共振峰参数在语音识别中 的应用 把所提取出的共振峰及其带宽作为特征参数用于一个小词 汇量的汉语语音识别系统中 实验表明其识别正确率达到了 98% 把共振峰参数作为动态特性应用到动态 HMM 模型中 使一个大词汇 量中文语音识别系统的错误率下降了近 10% 基音周期是语音的另一个基本特征 基音提取是语音信号处理中 一个重要的课题 在语音压缩编码 语音识别 尤其是汉语语音识 别中有着重要意义 人们已经提出了多种基音提取方法 然而各种 方法一般都有其固有的局限性 难以在各种情况下都保持较好的性 能 针对这种情况 本文提出了一种综合的算法 综合运用了平均 幅度差法 自相关函数法和简单逆滤波器跟踪法等多种算法对候选 的基音频率点进行打分 最后再用动态搜索的算法找出一条全局最 优路径 从而避免了单一方法的局限性 取得了很好的性能 本文还讨论了基音参数在语音识别中的应用 通过两种方法在语 音识别系统中应用基音参数 一种是通过把基音参数加入到识别参 量中去直接在 HMM 模型中应用 在汉语连续数字串 汉语小词汇量 I II 的短语集以及汉语大词汇量连续语音三种情况下对该方法进行了测 试 实验结果表明系统识别率获得了一致的提高 提高的幅度超过 10% 这种直接应用基音参数的方法实现起来简单统一 可以在任何 带调语音识别系统中进行应用 另一种方法是通过基于规则的方法 应用基音参数 在汉语连续数字串的语音识别系统中 根据声调基 音包络的不同 设计一组规则来对不同的基音包络曲线进行区分 从而达到区分易混淆数字对的目的 这种方法在识别率的提高上比 第一种方法的性能要好 但只能应用于某些特定的语音识别系统 并且须针对该系统设计规则 不具有通用性 汉语有五个基本的声调 它靠特征参数中的基音包络来表达 声 调识别在汉语语音识别中有着重要意义 它能帮助准确地识别出汉 语音节 以及简化识别系统中后端的语法模型 从实用性 稳健性 出发 本文建立了两个针对大词汇量中文连续语音的声调识别系统 一个基于隐马尔科夫模型 另一个基于人工神经网络方法 本文详 细讨论了这两个系统的系统结构 特征提取 音节切分 模型设置 等问题 并结合声调的特点 考虑了上下文相关的模型 使声调识 别系统的性能达到了最优 对比隐马尔科夫模型和人工神经网络两 个声调识别系统 可以看到基于人工神经网络的方法识别性能要稍 优于基于隐马尔科夫模型的方法 但是基于神经网络的系统要求有 个额外的音节切分步骤 并且系统的识别率在很大程度上依赖于该 音节切分算法的准确性 关键词 语音识别 特征提取 共振峰 基音周期 声调识别 PAGE PAGE IV STUDY ON ACOUST IC FEATURES AND TONE R E C O G N IT ION OF SPEECH RECOGN IT IO N ABSTRACT Feature Extraction and Selection is fundamental in speech recognition. Extracting features precisely and presenting them appropriately in a speech recognition system is elemental to gain good performance. Formant is a basic feature of speech. Because of the limitation of present formant extraction algorithm, a method based on inverse filter is proposed to extract the formant parameters. A bank of inverse filters is used to approach the Short Time Fourier Transform of speech signal. The dynamic programming algorit

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档