- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于VQ的孤立词识别 语音识别一般分两个步骤。 学习(训练):建立识别基本单元的声学模型、文法分析的语言模型,存放于语音参数库。 识别(测试):根据一定的准则和测度将待识别模型与系统模型进行比较,判决得出结果。 识别过程涉及的基本原理 失真测度:在识别中,对待识别语音特征参数与训练特征参数的失真度量。 主要识别框架:基于模式匹配的动态规整、VQ和基于统计模型的GMM、HMM 概述 语音识别原理和识别系统组成 基于模式匹配VQ的语音识别 VQ用于语音识别共有四个步骤:特征提取、模板训练、模板分类、判决。 1、预处理: 主要包括抗混叠滤波 预加重 端点检测等。 2、语音特征参数提取: 时域特征:短时平均能量、短时平均过零率、共振峰、基音周期等; 频域特征:线性预测系数(LPC)、LP倒谱系数(LPCC)、线谱对参数(LSP)、短时频谱、Mel频率倒谱系数(MFCC)等。 语音识别原理和识别系统组成 3、参考模板 根据每个孤立词的训练数据生成每个孤立词的VQ模型 4、判卷准则 根据欧式距离进行结果选择 语音识别原理和识别系统组成 基于VQ的MATLAB程序结构 训练过程 MFCC_Tiwuzaosheng.m:提取孤立词的MFCC,用于聚类 提取所有孤立词的训练样本MFCC,每个孤立词保存为一个cell,这样可以在矢量量化时得到每个孤立词的聚类中心。保存的变量为: MFCC.mat 在程序运行之前首先要对训练样本进行归类,就是每个孤立词一个文件夹,这样可以得到每个孤立词的MFCC系数。 基于VQ的MATLAB程序结构 基于VQ的MATLAB程序结构 MFCC_Tiwuzaosheng.m的结果是提取每个孤立词每个训练语音样本的MFCC系数,且保存为MFCC_trainlist.mat文件 MFCC参数的格式是:每个孤立词一个structure 每个structure一个cell,包含了60个样本的MFCC系数 kmeans_vq.m:根据提取的MFCC系数,通过K均值聚类方法,得到每个孤立词的VQ中心矢量,用于识别。每个孤立词聚类中心都保存在kmeans_cent.mat变量中。 每个孤立词的MFCC进行一次VQ聚类,得到矢量中心,这里我们设置聚类个数为20. 基于VQ的MATLAB程序结构 识别过程 总的识别运行程序为:recognize.m 基于VQ的MATLAB程序结构 Shibie.m recognize.m disteu.m 1.完成基于VQ的孤立词识别系统仿真 2.改变MFCC系数阶数、每个孤立词VQ聚类个数、每个孤立词训练样本数时,分析系统的识别率差异 3.将原有的孤立词进行改变,识别孤立词为0、1、2,…,9十个数字,或者其它的10个孤立词,自己录制训练样本,实现不同孤立词的识别系统,并分析系统性能。 任务要求
您可能关注的文档
最近下载
- Web报表工具FineReport的JS API(一).pdf VIP
- Web报表工具FineReport中JavaScript的使用.docx VIP
- Web报表工具FineReport的JS API开发(二).pdf VIP
- (高清版)ZT 0142-2010 航空磁测技术规范.pdf VIP
- 肖申克的救赎经典台词肖申克的救赎经典语录中英文对照.docx VIP
- 张恩利-体育俱乐部的经营与管理(运训).ppt VIP
- 新改版教科版三年级上册科学全册知识点梳理与总结.doc VIP
- DB65T2052-2011 库尔勒香梨贮藏保鲜技术规程.pdf VIP
- Web报表工具FineReport的JS开发之字符串.pdf VIP
- 《商务英语翻译》课件——产品说明的翻译原则2.pptx VIP
文档评论(0)