robust话识别中统计模型的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
robust话识别中统计模型的研究

中周科学技术人学倾I+论艾 摘婺 捅 要 f随着社会信息化程度的发展,越来越多的场合需要刈人的身份进行快速、i,J‘ 靠地识别或确认。由于通过语音信号进行身份认证较之传统身份认证方法有着不 可比拟的优点:如它不会丢失、被盗、或遗忘,且语音信号采集方便,乐意被人 们接受和使用。因此利用语音进行身份识别越来越受到人们的重视。髓|ji『话者茁{ 别系统正从实验室阶段逐步走向实用化、大删模,其一I,捉l钶泌别系统的鲁林性是 实用化的关键订本文以提高话者识别系统的鲁棒性为目标,深入研究了目日口广‘泛 应用于语音处理的两种统计模型一隐马尔科夫模型(1lMM)和高斯混合模型(GMM), 重点研究了这两种统计模型在鲁棒性上的不足,提出了关于这两种统计模型的改 进模型,使话者识别系统的鲁棒性得到较大提高。 本文的主要研究内容与工作成果如下: 1.(对参数级抗噪方法的研究,我们以MFCC特征参数为重点,研究了动态型 参数对于提高系统鲁棒性的作用。并且勰f:f{了一种只有良好的噪声鲁棒性的丛r 小波变换和频谱重构的语音特征参数(DwTWCC)。伪了更好的模拟听觉感知机卫H, 我们还对耳蜗模型进行了一定的研究,实现了一种耳蜗滤波器的模型,并深入研 究了语音信号的耳蜗滤波输出的一些特点斗 / 2.以与文本相关的话者辨识为sF台,深入1jJ}究了隐码尔科人模型(IIMM)征 鲁棒性能方面的不足,并针对其缺陷,对传统的ItMM进行了改进,提出了一利·麒 ta 有强鲁棒性的HMM结构--DeIIIMM。似模型的基本思想足将静念参数与静态IIMM 模型的状态对应,而动态参数则与状态之间的转移相对应。从而使得模型中的状 态之问通过动态参数相联系,使得语音参数中的帧阃相关性得到了体现,因此对 语音信号的时序过程有更好的刻画精度。并且IiH:将动态型参数与静态型参数分 别作用于模型的不同部分,实现了不同类型特征的自适应融合,从而显著提商了 融合后系统在各利-情况下的性能。在OdB的噪Jii环境卜,性能较传统IIMM捉商了 2胪1。土 3.以文本无关的活者确认为平台,对(:MM—UBM结构框架进行了深入研究, 重点研究了基于GMM的话者确认系统的通道鲁棒性,捉fJ{了…种更具鲁棒性的 征分柚j与非限定况话人语音特征的分御。这就使得测试语音中的噪卢段在UBM 模型和特定人模型上的输出相近,并通过相减得到很好的抑制。因此GMM—UBM 系统的鲁棒性能较传统的单独为不同话者训练统计模型的方法来况有较火改善, 但是这种系统对于训练数据的要求较为严苛。因此,我们从改进传统高JtJi}td,合模 型(GMM)的结构出发,将原米的单以结构改为坝层结构,从而使得在单层结构 中『蝴科学技术人学坝lj论文 摘蜡 中分布相近的高斯混合度合Ji二成为双层结构小的坝层^i,川属一个顶层’1¨i的 高斯混合度在训练时可以唰享数据,从而提商了训练数扒fI,JfIJ/n效率和话肯模型 的性能。我们以HGMM为基础构建的话者确认系统代表微软亚洲研究院参加l了今 ofScience Institute 年美国国家科技局(National and’technology)主办的 话者识别评测中,获得Multi—modal单项评比的第 名文 巾I马科学技术人学埘I+论文 樊殳摘蜚 Abstract and Inthe oftheInformation inour arelnore development Tech

文档评论(0)

jiuqie957379 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档