基于神经网络的汉语孤立词语音识别.PDF

基于神经网络的汉语孤立词语音识别.PDF

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于神经网络的汉语孤立词语音识别

第28卷第3期 01 北京工业大学学报 v 28№3 2002年9月 JOL刚AL oFBElⅡNGP。LyrBC}咖C uNrvERsrrr Se吐2002 基于神经网络的汉语孤立词语音识别 孙光民,董凳盈 (北京工业大学电子信息与控制工程学院,北京 100022) 摘要:研究了基于神经网络的中文孤立词语音识别技术;将时间规整算法与神经网培相结台,组成一个幌台级 联神经网络语音识剐系统.在这个模型中,第一级是时间规整神经网络.其作用是完成时间规整功能,从输入 不等长的语音信号特征矢量序列中提取固定长度的特征矢量;然后将这组特征矢量馈^后一级BP网络完成语 音调别.利用该方法对小词表汉浯孤立词进行语音识别实验.获得了98.25%的正确识别率.实验结果表明.该 系统不仅利用神经网络解嵌了语音识别中的时间规整难题,而且识别性能明显得到改善,识别率和训练速度均 优于采用线性时间规整的神经网络语音识别方法. 关键词:语音识别;人工种经网络;时间规整 9123 中圈分类号:TN 文棘标识码:A 文章鳙号:0254一呻37(2002)03-0289—04 近年来,随着计算机技术的不断发展和广泛应用,语音识别技术得到了迅速发展,先后提出了动态规 理论等.尽管如此,目前语音识别研究中仍然存在着大量难题迫切需要解决.为了解决这些难题,研究人 员又提出了各种新的修正方法”。“;所有这些努力都取得了一定成果,尤其是基于人工神经网络的语音识 别系统受到人们的极大关注”“。.作者主要研究了基于神经网络的中小词表汉语孤立词语音识别技术.将 人工神经网络中最经典的Bp网络应用于语音识别,并针对BP网络用于语音识别时所遇到的时间对准问 题,提出一种时间规整网络与BP网络棍合而成的分类器模型,用于对小词表中文孤立词识别. 1 语音信号特征提取 特征提取是语音识别的基础.因为语音信号中含有丰富的信息,进行语音识别,首先要进行特征提取, 将高维的原始信号空间变换到较低维的特征空间,即对语音信号进行分析处理,去除对语音识别无关的信 息,提取有用的信息.对于非特定人语音识别,希望特征参数尽可能多地反映语义信息,减少个人信息. 线性预测(LP)分析法在语音识别时可用于特征提取.它通过采用一组简洁的语音信号模型参数来表达 语音信号的频谱幅度,这些参数一般可看做是由线性预测系数推演而来.常用的参数包括倒谱系数,反射系 数等.在语音识别中,最常用的是倒谱系数.p阶线性预测倒谱系数的递推公式可表示为 fc(I)=日1 。(。):{。4 掣 (1) 卜(i)2乞(1一£,f)d^ l,尸 l ^=I 倒谱f(”)实际上是信号z变换的对数函数的反z变换,一般通过信号的傅里叶变换,对其模取对数, 再求反傅里叶变换得到.因为线性预测分析法是一种谱估计方法,而且预测滤波器的频率响应日(e,“)反 映了声道的频率响应和信号的谱包络.所以用IogIH(e1“)l作反傅里叶变换求出的倒谱系数便是一种描 述语音信号的良好参数,并且计算量不大.往往只需要十几个倒谱系数就能较好地描述语音的共振峰特 收稿日期:2002.04.11. 作者简介:孙光民(1960一),男,副教授,博士 万方数据 』塑L——————————————一i!—』三些查兰兰塑 !!!!生 性,因此用于语音识别时,可以降低特征矢量维数,减少训练和识别时问. 作者选用加权的线性预测倒谱系数.首先应用Burg算法计算线性预测系数,然后递

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档