基于VQ的孤立词识别.ppt

下载文档 降价啦

13
0
约1.19千字
约 14页
2019-07-16 发布于山东
举报
版权申诉
保障服务

基于VQ的孤立词识别.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于VQ的孤立词识别语音识别一般分两个步骤。学习（训练）：建立识别基本单元的声学模型、文法分析的语言模型，存放于语音参数库。识别（测试）：根据一定的准则和测度将待识别模型与系统模型进行比较，判决得出结果。识别过程涉及的基本原理失真测度：在识别中，对待识别语音特征参数与训练特征参数的失真度量。主要识别框架：基于模式匹配的动态规整、VQ和基于统计模型的GMM、HMM 概述语音识别原理和识别系统组成基于模式匹配VQ的语音识别 VQ用于语音识别共有四个步骤:特征提取、模板训练、模板分类、判决。 1、预处理：主要包括抗混叠滤波预加重端点检测等。 2、语音特征参数提取：时域特征：短时平均能量、短时平均过零率、共振峰、基音周期等；频域特征：线性预测系数(LPC)、LP倒谱系数(LPCC)、线谱对参数(LSP)、短时频谱、Mel频率倒谱系数(MFCC)等。语音识别原理和识别系统组成 3、参考模板根据每个孤立词的训练数据生成每个孤立词的VQ模型 4、判卷准则根据欧式距离进行结果选择语音识别原理和识别系统组成基于VQ的MATLAB程序结构训练过程 MFCC_Tiwuzaosheng.m：提取孤立词的MFCC，用于聚类提取所有孤立词的训练样本MFCC，每个孤立词保存为一个cell，这样可以在矢量量化时得到每个孤立词的聚类中心。保存的变量为： MFCC.mat 在程序运行之前首先要对训练样本进行归类，就是每个孤立词一个文件夹，这样可以得到每个孤立词的MFCC系数。基于VQ的MATLAB程序结构基于VQ的MATLAB程序结构 MFCC_Tiwuzaosheng.m的结果是提取每个孤立词每个训练语音样本的MFCC系数，且保存为MFCC_trainlist.mat文件 MFCC参数的格式是：每个孤立词一个structure 每个structure一个cell，包含了60个样本的MFCC系数 kmeans_vq.m：根据提取的MFCC系数，通过K均值聚类方法，得到每个孤立词的VQ中心矢量，用于识别。每个孤立词聚类中心都保存在kmeans_cent.mat变量中。每个孤立词的MFCC进行一次VQ聚类，得到矢量中心，这里我们设置聚类个数为20. 基于VQ的MATLAB程序结构识别过程总的识别运行程序为：recognize.m 基于VQ的MATLAB程序结构 Shibie.m recognize.m disteu.m 1.完成基于VQ的孤立词识别系统仿真 2.改变MFCC系数阶数、每个孤立词VQ聚类个数、每个孤立词训练样本数时，分析系统的识别率差异 3.将原有的孤立词进行改变，识别孤立词为0、1、2,…,9十个数字，或者其它的10个孤立词，自己录制训练样本，实现不同孤立词的识别系统，并分析系统性能。任务要求