- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一章 语音增强 数字语音处理及MATLAB仿真 教学课件
第十一章 语音增强 11.1 概述 在通信过程中语音受到来自周围环境、传输媒介引入的噪声,使接收到的语音信号并非纯净的原始语音信号,而是受噪声污染的带噪语音信号。这里的“噪音”定义为所需语音信号以外的所有干扰信号。 干扰信号可以是窄带的或宽带的、白噪声的或有色噪声的、声学的或电学的、加性的或乘性的,甚至可以是其它无关的语音。由噪声导致的语音质量的下降会使许多语音处理系统的性能急剧恶化。 采用语音增强技术进行预处理,可有效地改善系统性能。 语音增强的目标: 对收听人而言主要是改善语音质量,提高语音可懂度,减少疲劳感;对语音处理系统(识别器、声码器、手机)而言是提高系统的识别率和抗干扰能力。 目前国内外有关抗噪声技术的的研究成果大体分为三类解决方法: 1. 采用语音增强算法,提高语音识别系统前端预处理的抗噪声能力,提高输入信号的信噪比; 2. 寻找稳健的语音特征作为特征参数,实验证明,这类参数对宽带语音具有较好的抗噪性; 3. 基于模型参数自适应的噪声补偿算法。 解决噪声问题的根本方法是实现噪声和语音的自动分离,但由于技术的难度,这方面的研究进展不大。近年来,随着声场景分析技术和盲分离技术的研究发展,利用在这些领域的研究成果进行语音和噪声分离的研究取得了一些进展。 11.2 语音感知特性和噪声特性 11.2.1 语音特性 1. 语音信号具有短时平稳性 声道形状有相对稳定性,在一段时间内(10ms~30ms),人的声带和声道形状是相对稳定的,可认为其特征是不变的,因而语音的短时谱具有相对稳定性,在语音分析中可以把语音信号分为若干分析帧,每一帧的语音可以认为是准稳定的。语音增强可以利用这种短时平稳性。 2.语音信号可以分为浊音和清音 语音可以分为周期性的浊音和非周期性的清音。在语音增强中,可以利用浊音的周期性特征,采用梳状滤波器提取语音分量或者抑制非语音信号,而清音则难以与宽带噪声区分。 3.语音信号可以利用统计分析特征描述 作为一个随机过程,语音信号可以利用许多统计分析特征进行分析。 语音的短时谱幅度统计特征是时变的,只有当分析帧长趋于无穷大时,才能近似具有高斯分布。在高斯模型的假设中,可以认为傅里叶展开系数是独立的高斯随机变量,均值为零,而方差是时变的。在有限帧长时这种高斯模型只是一种近似的描述,可以作为分析的前提在宽带噪声污染的带噪语音增强中应用。 11.2.2 人耳感知特性 人耳对语音的感知主要是通过语音信号频谱分量幅度获取的,对各分量相位则不敏感,对频率高低的感受近似与该频率的对数值成正比。 人耳具有掩蔽效应,人耳除了可以感受声音的强度、音调、音色和空间方位外,还可以在两人以上的讲话环境中分辨出所需要的声音,这种分辨能力是人体内部语音理解机制具有的一种感知能力。人类的这种分离语音的能力与人的双耳输入效应有关,称为“鸡尾酒会效应”。 语音增强的最终效果度量是人耳的主观感觉,所以在语音增强中可以利用人耳感知特性来减少运算代价。 11.2.3 噪声特性 通过语音增强技术改善语音质量的过程如下图所示: 11.3 语音增强算法 目前语音增强算法大致可以分为四种: 参数方法 非参数方法 统计方法 其它方法 11.3.1 参数方法 此类方法主要依赖于使用的语音生成模型(例如AR模型),需要提取模型参数(如基音周期、LPC系数),常常使用迭代方法。如果实际噪音或语音条件与模型有较大的差距,或提取模型参数有困难,则此类方法容易失效。采用滤波器模型时,典型的有梳状滤波器、维纳滤波器、卡尔曼滤波器等。 语音的全极点生成模型如图所示: 语音的全极点生成模型中 激励源为:u(n) ;增益因子为:g;语音信号为:s(n) 全极点滤波器为: , 根据全极
您可能关注的文档
- 第六章宏观经济变量及短期经济波动.ppt
- 第六章小学班级活动管理 班级管理课件.ppt
- 第六章小结 毛概 教学课件.ppt
- 第六章完全竞争市场 西方经济学.ppt
- 第六章工资生成理论 劳动经济学课件.ppt
- 第六章复合肥料 植物营养与肥料课件.ppt
- 第六章复合肥料1植物营养与肥料课件.ppt
- 第六章图 LAN的组成 《计算机网络及应用》电子教案.ppt
- 第六章呼吸系统疾病 病理解剖学教学课件.ppt
- 第六章广告社会监督 广告管理 教学课件.ppt
- 安全监察人员高分题库附完整答案详解【典优】.docx
- 2025年安全监察人员能力提升B卷题库及参考答案详解【能力提升】.docx
- 2025年安全监察人员常考点试卷含答案详解【培优】.docx
- 2025安全监察人员能力检测试卷【考点提分】附答案详解.docx
- 高职单招通关题库【学生专用】附答案详解.docx
- 2025年安全监察人员模考模拟试题含答案详解(达标题).docx
- 2025安全监察人员模拟题库带答案详解AB卷.docx
- 安全监察人员综合提升测试卷【基础题】附答案详解.docx
- 2025年安全监察人员经典例题附参考答案详解【典型题】.docx
- 2025安全监察人员全真模拟模拟题带答案详解(培优B卷).docx
文档评论(0)