非平稳低信噪比噪声环境下的鲁棒语音活动检测技术的研究.pdf

非平稳低信噪比噪声环境下的鲁棒语音活动检测技术的研究.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
国内图书分类号:TP39 学校代码:10213 国际图书分类号:681.3 密级:公开 工工工学学学博博博士士士学学学位位位论论论文文文 非平稳低信噪比噪声环境下的鲁棒语音活 动检测技术研究 博士研究生:邓世文 导 师:韩纪庆 申 请 学 位:工学博士 学 科:人工智能与信息处理 所 在 单 位:计算机科学与技术学院 答 辩 日 期:2012 年5 月 授予学位单位:哈尔滨工业大学 Classified Index: TP39 U.D.C: 681.3 Dissertation for the Doctoral Degree in Engineering RESEARCH ON ROBUST VOICE ACTIVITY DETECTION IN THE LOW SIGNAL TO NOISE RATIO AND NON-STATIONARY NOISE ENVIRONMENTS Candidate: Deng Shiwen Supervisor: Prof. Han Jiqing Academic Degree Applied for: Doctor of Engineering Specialty: Artificial Intelligence and Information Processing Affiliation: School of Computer Science and Technology Date of Defence: May, 2012 Degree-Conferring-Institution: Harbin Institute of Technology 摘 要 摘 要 语音活动检测是指在连续输入的声音信号中自动地检出语音存在时段的 一种检测技术。它是语音信号处理的一个重要环节,在语音处理的多个研究 领域中有着广泛的应用。近年来,随着各种现实应用服务对语音处理技术的 需求日益增加,对新环境下的语音活动检测技术也提出新的挑战,这主要表 现为非平稳低信噪比环境下的鲁棒语音活动检测问题,它是语音处理中的一 个重要的亟待解决的热点问题。近十余年来,虽然研究者们对此问题提出了 许多检测方法,并取得了长足进步,但当前所取得的成果与实际的系统需求 还有较大的距离。 语音活动检测,从处理问题的应用环境上可分为噪声类型已知且不变的 限定环境,以及噪声类型未知且变化的开放环境下的检测方法。本文分别从 检测方法是否需要快速响应两个角度,对限定环境和开放环境下的语音活动 检测进行了研究,提出了一系列解决方法。论文的主要创新工作包括: (1)提出了以信号稀疏表示为鲁棒特征的语音活动检测方法。在噪声 类型不变的限定环境下,语音与环境噪声在信号结构上有着明显的区别,可 用做语音∕非语音的鉴别特征。然而,在低信噪比环境下传统的基于正交分 解提取信号结构信息的方法容易受噪声干扰,从而使特征失去鲁棒性。针对 这一问题,本文提出使用基于原子字典稀疏分解的方法来获取信号的结构信 息,将分解得到的信号稀疏表示作为语音∕非语音的鉴别特征用于语音活 动检测。依据构造字典所使用的先验知识的不同,将原子字典分为预构建字 典和学习字典,文中讨论了在语音检测问题中两种字典的构造方法,并分别 提出了基于预构建字典和学习字典下信号稀疏表示的检测方法。此外,本文 还基于分层Bayesian 模型从理论上论证了将稀疏表示作

文档评论(0)

liybai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档