PLP与MFCC在藏语连续语音识别系统中的比较.docVIP

下载本文档

4
0
约3.13千字
约 6页
2017-06-19 发布于湖北
举报

PLP与MFCC在藏语连续语音识别系统中的比较.doc

PLP及MFCC在藏语连续语音识别系统中的比较【摘要】本文论述了常用的语音特征参数，并分析了mel频谱倒谱系数（mfcc）和感知线性预测系数（plp）的计算方法，并在藏语拉萨话大词表连续语音识别系统中分别提取mfcc和plp参数，并对识别结果进行了比较. 【关键词】 mel倒谱感知线性预测系数 mfcc plp 语音识别藏语自动语音识别研究起始于上世纪50年代，80年代最大突破是隐马尔科夫模型（hmm）的应用，语音识别研究重点从特定人、小词表、孤立词语音识别向非特定人、大词表、连续语音识别转移；90年代以来，语音识别在模型细化、参数提取和优化、系统自适应方面取得重大突破.进入本世纪，著名的研究机构和公司，如剑桥大学、ibm、cmu大学、微软、贝尔实验室等机构的大词表连续语音识别系统对特定说话人的识别率达到95％左右.面对中国未来市场，国外ibm、apple、motorola等公司投入到汉语语音识别系统的开发. 我国语音识别研究虽然起步较晚，但发展发展迅速，中国科学院自动化研究所、声学研究所及清华大学、北京交通大学等机构都开展了语音识别的研究，总体上，汉语连续语音识别的研究与国外先进技术相差不大。实际环境对语音识别的声学噪声鲁棒性要求越来越高,因此,提取具有鲁棒性和较强区分能力的特征向量对语音识别系统具有重要的意义.目前常用的声学特征参数有基于线性预测分析(lpc)的倒谱

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

PLP与MFCC在藏语连续语音识别系统中的比较.docVIP