- 3
- 0
- 约2.9千字
- 约 7页
- 2018-08-30 发布于福建
- 举报
基于词组语音识别模型研究
基于词组语音识别模型研究
摘要:本文在简单介绍三种词组语音识别模型后,提出了采用离散隐马尔柯夫模型(DHMM)来构建语音识别系统,并在此基础上引入矢量量化(VQ)模块来保证识别率和识别速度,具有良好的实用性。
关键词:矢量量化模块;语音识别;隐马尔柯夫模型
中图分类号:TP391.42 文献标识码:A文章编号:1007-9599 (2011) 14-0000-01
Phrase-Based Speech Recognition Model Study
Chen Fengliang,Peng Shengze
(Mianyang Teachers College,Mianyang621000,China)
Abstract:This paper describes three kinds of phrases in a simple speech recognition model,the paper introduces the discrete hidden Markov model(DHMM)to build speech recognition systems,and on this basis,the introduction of vector quantization(VQ)module to ensure that the recognition rate and recognition speed,with good usability.
Keywords:Vector quantization module;Speech recognition;Hidden Markov model
一、语音识别模型概述
(一)人工神经网络模型。人工神经网络模型的本质是利用大量简单的处理单元进行相互的交叉连接,从而构建出一种较为复杂的信息处理系统。该模型特点是模拟了人类神经元的活动方式,因而具有自学以及推理能力,同时还具有高并行处理能力和容错能力。但该模型数据计算量庞大,模板训练和语音识别算法的实现过程较为复杂,且识别贡献率相比其他模型而言并不具有优势。(二)隐马尔柯夫模型。隐马尔柯夫模型是一种描述语音信号动态变化并具有动态时间规整能力的统计模型,是一种双重随机过程,对准平稳事变信号能够进行有利的分析。该模型具有高准确率的描述语音信号特征能力。其缺点是数据计算量相对较大。(三)动态时间规整。动态时间规整是一种动态规划思想,它利用局部的最佳化原则来搜寻出一条自动的最佳路径,从而使得两个特征参数矢量间的失真度最小。动态时间规整采用时间校准特征参数序列,可有效解决语音信号在时间上的对不准问题。其缺点是仅对特定人的语音识别具有较理想的识别效果,并且需要对关键词组所涉及的可能所用样本进行训练,否则识别效果将降低。
以上三种模型都存在各自局限性,但综合比较而言,隐马尔柯夫模型具有较高的综合性能。本文提出采用离散隐马尔柯夫模型(Discrete Hidden Markow Model,DHMM)来构建语音识别系统,并在此基础上引入矢量量化(Vector Quantization,VQ)模块来保证识别率和识别速度。
二、基于DHMM和VQ的语音识别系统的总体结构
针对连续隐马尔柯夫模型(CHMM)计算量大并且难以用硬件电路来描述实现的缺点,本文提出的基于DHMM和VQ的语音识别系统在端点检测、特征提出等几个方面进行改进,以减少计算量并提高识别率。基于DHMM和VQ的语音识别系统的总体结构如图1所示:
训练
模板参考
识别判定
图1:基于DHMM和VQ的语音识别系统的总体结构
(一)状态机法端点检测。传统的双门限法检测不易于采用硬件电路实现,并且难以对对语音信号进行实时的端点检测。本文所提出的状态机法端点检测方法能够解决双门限法检测的缺陷,适合对语音信号进行实时的检测,并且能用硬件电路来实现。状态机法端点检测的本质就是将能量状态以及过零率状态变迁过程中每帧信号装变成状态值,然后根据这些状态值的逻辑关系来完成端点检测。该检测方法具有计算量小、存储空间小的特点。(二)MFCC特征提取。MFCC模拟了人耳听觉感知方面以及人耳对语音的响应特征,更加符合人类的真实听觉特性。同时,MFCC在噪声环境下能够表现出良好的识别性能以及鲁棒性,并不依赖于全极点模型假定。因此,在非特定人语音识别中能够有效减少不同说话人的口音、方言带来的干扰,能够提高识别性能。(三)离散隐马尔柯夫模型。传统的CHMM模型具有计算量大、存储量大的缺点,导致难以用硬件电路来描述。针对这一现象,本文所提出的离散隐马尔柯夫模型参数B为离
您可能关注的文档
- 基于计算机视觉技术课堂自动考勤系统研究.doc
- 基于计算机视觉昆虫识别研究.doc
- 基于计算机视觉施工现场车辆监管技术研究.doc
- 基于计算机视觉植物黑腐病病斑分析.doc
- 基于计算机视觉测量技术PCB贴片检测研究与应用开发.doc
- 基于计算机视觉理论石材大板表面轮廓提取算法研究.doc
- 基于计算机视觉结构动位移测试.doc
- 基于计算机视觉葡萄叶部病害识别研究.doc
- 基于计算机视觉马铃薯外部品质检测应用研究.doc
- 基于计算机视觉运动目标跟踪算法.doc
- 伟明环保-市场前景及投资研究报告-境内业务稳健运行,印尼市场贡献边际增量.pdf
- 桂东县法院系统招聘考试真题2025.pdf
- 贵州省黔南布依族2026年中考三模物理试题及答案.pdf
- 贵州省黔南州2026年中考语文二模试卷附答案.pdf
- 贵州省铜仁市2026年中考语文二模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套完整答案详解.docx
- 贵州省毕节市2026年中考语文一模试卷附答案.pdf
- 贵州省贵阳市南明区2026年中考语文一模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套参考答案详解.docx
- 贵州省贵阳市白云区2026年中考二模物理试题附答案.pdf
最近下载
- 部编版(26春)小学语文一年级下册教学设计全册.docx VIP
- 春节复工煤矿工人培训教案.pptx VIP
- Haier海尔蒸箱ST450-30S说明书.pdf
- Joyoung九阳电饭煲F30S-S160使用说明书.pdf
- 2025年新疆中考物理试题(含答案详解)原卷.pdf
- 79博客-目录书签跳转版.pdf VIP
- 计算智能 课件全套 第1--11章 绪论、模糊系统理论---新型群智能优化算法.pptx
- 2025年国庆节后煤矿复产复工'六个一'安全资料汇编.docx VIP
- 2023中国生物材料大会会议手册-ok.pdf VIP
- Midea 美的 ET1065QL-01SE嵌入式电烤箱 说明书.pdf
原创力文档

文档评论(0)