自適应矢量量化在语音识别中的应用.docVIP

自適应矢量量化在语音识别中的应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自適应矢量量化在语音识别中的应用

课程编号 07S19C0307 课程名称 数字语音信号处理 学期 2010 年春 学位层次 硕士 适合专业 通信与信息系统 共 页第 页 自适应矢量量化在语音识别中的应用张恒河北工业大学 信息工程学院 通信与信息系统 学号:201020195009摘要:介绍了用离散隐马尔可夫模型( DHMM)构造孤立词语音识别系统中的特征向量矢量量化的码书构造过程。 以往的矢量量化通常采用基本算法LBG, 在此基础上, 引入了一种时间复杂性和空间复杂性有所降低的改进算法。该算法的核心是自适应地生成初始码书以及对初始码书的二次构造过程。从降低时间复杂度和节省存储空间,提高识别率的角度, 对该算法进行了讨论。关键词:语音识别;矢量量化;LBG;自适应码书 1 引言现代语音识别中最常用的识别方法是 Baum 等人提出的隐马尔可夫模型(HMM)。HMM 是数学上一类重要的双重随机模型, 用概率统计的方法描述时变语音信号,很好地描述了语音信号的整体非平稳性和局部平稳性。HMM 的各状态对应语音信号的各平稳段, 各状态之间以一定转移概率相联系,是一种较为理想的语音模型。在孤立词语音识别过程中, 通常采用离散隐马尔可夫模型(DHMM) , 取得了比较好的实用效果参考文献:???易克初,田斌,付强.语音信号处理[M].北京:国防工业出版社,2000.参考文献:???易克初,田斌,付强.语音信号处理[M].北京:国防工业出版社,2000. [2]Linde Y, Buzo A, Gray R M. An Algorithm fot Vector Quantizer Design[J].IEEE Transactions on Communicartions,1980,28(1):80-85.在构造离散隐马尔可夫模型(DHMM) 过程中, 对提取的MFCC特征参数矢量量化的码书构造是其中的一个主要部分, 码书的选择会影响时间和空间的复杂度以及整个系统的识别率。目前为止, 矢量量化的方法很多, 其中最典型的是1980年, Linde, Buzo 和 Gray提出的LBG算法[3]David Salomon.数据压缩原理与应用[M].2版.吴乐南,译.北京:电子工业出版社,2003.[3]David Salomon.数据压缩原理与应用[M].2版.吴乐南,译.北京:电子工业出版社,2003.2 LBG算法LBG算法是一种有效和直观的矢量量化码书设计算法, 其具体算法描述如下[4]陆哲明.矢量量化编码算法及应用研究[D].哈尔滨:哈尔滨工业大学,2001.[4]陆哲明.矢量量化编码算法及应用研究[D].哈尔滨:哈尔滨工业大学,2001. 训练矢量集为为训练适量的个数。给定出师码书:,令迭代次数k=0.平均失真,给定相对误差门限。(2)用码书中的各码字作为质心,根据最佳划分原则把训练矢量集X划分为N个细胞腔,满足: (1)其中。(3)计算平均失真 (2)判断相对误差是否满足 (3)若满足,则停止算法,码书就是所的码书,否则就转步骤(4)。(4)根据最佳码书条件,计算各细胞腔的质心,即: (4)由这n个新质心,i=0,1,…,N-1 形成新码书,置n=n+1,转步骤(2)。LBG算法有3个主要缺点:(1) 码书的自适应性不强,不能根据训练矢量集数据的随机分布自适应地取得初始码书;(2) 在每次迭代的最佳划分阶段,从码书中搜索训练矢量的最近码字需要大量的存储空间和繁琐的计算;(3) 初始码书的选择影响码书训练的收敛速度和最终码书的性能。传统的初始码书生成方法或者采用随机生成或者采用分裂法[5]Gray M.Vector Quantization.IEEE ASSP Magazine,1984,1(2):4-29.[5]Gray M.Vector Quantization.IEEE ASSP Magazine,1984,1(2):4-29. 3 自适应二阶码书设计算法 在这部分中,阐述了一种自适应二阶码书(AutomatorSecond Book,ASB) 生成算法, 他提高了码书的自适应性能,且设计的时间和占用的存储空间与 LBG算法相比均有所降低。3.1 自适应码书生成 传统的矢量量化方法LBG的一个缺点是自适应性不强,ASB 算法自适应的生成一阶码书,提高了码书的自适应性。 利用每一语音样本MFCC特征参数的范数,求出每一语音样本MFCC特征参数的范数,即的欧几里德内积。 所有MFCC参数中最小的欧氏距离min d,最大的欧氏距离max d。N个码字的平均欧氏距离: (5) 在N个等分的同心圆环区域,可以理解为N个同心圆内 (如图1所示),自适应的划分任一图像子块落在哪

文档评论(0)

dbtx + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档