多通道语音增强的方法简介.docVIP

下载本文档

10
0
约3.55千字
约 8页
2018-10-15 发布于福建
举报
版权申诉

多通道语音增强的方法简介.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

多通道语音增强的方法简介

多通道语音增强的方法简介　　【摘要】由于多麦克风越来越多地部署到同一个设备上，基于双麦克风和麦克风阵列的多通道语音增强研究有了较大的应用价值。介绍了自适应噪声对消法、FDM等双通道语音增强方法和波束形成、独立分量分析等麦克风阵列语音增强方法，对各个方法的原理、发展和优缺点进行了详细分析和总结，对多通道语音增强深入研究有一定帮助。　　【关键词】语音增强；双通道；麦克风阵列；波束形成　　1.引言　　语音是人们通讯交流的主要方式之一。我们生活的环境中不可避免地存在着噪声，混入噪声的语音会使人的听觉感受变得糟糕，甚至影响人对语音的理解。在语音编码、语音识别、说话人识别等系统中，噪声也会严重影响应用的效果。语音增强成为研究的一个问题，其模型如图1所示。　　图1 语音增强模型　　按照采集信号的麦克风数量分类，语音增强方法可被分为单通道（single channel）、双通道（dual-channel）、麦克风阵列（microphone array）三种类型。一般来说，麦克风越多，去噪的效果越好。早期，大部分通信/录音终端都只配有一个麦克风，因此单通道语音增强吸引了大量研究者的目光，方法较为成熟。但单通道方法的缺点是缺少参考信号，噪声估计难度大，增强效果受到限制。近年来随着麦克风设备的小型化和成本的降低，双麦克风和麦克风阵列越来越多地被部署。研究者的注意力也在从单通道语音增强向双通道和麦克风阵列语音增强转移，这里对已有的多通道语音增强算法作以简单介绍。　　2.双通道语音增强方法　　在语音增强中，一个关键的问题就是获得噪声。在单通道语音增强中，噪声是通过从带噪语音信号中估计得到的，估计算法较为复杂且估计噪声总是与真实噪声存在差异，这就限制了增强效果的提高。为了获得真实噪声，简单的做法就是增加一个麦克风来采集噪声。从带噪语音信号中减去采集噪声来得到语音信号，这种方法叫做自适应噪声对消法（ANC，adaptive noise canceling），是最原始的最简单的双通道语音增强算法。针对双麦克风开发的算法不多，主要有噪声对消法、一阶差分麦克风（FDM，first-order differential microphone）及基于FDM改进得到的自适应零陷波束形成法（ ANF，adaptive null-forming）。　　2.1 自适应噪声对消法　　噪声对消法采用两个麦克风，一个麦克风采集带噪语音，另一个采集噪声信号，用带噪信号减去噪声信号，得到语音信号。减操作一般在频域进行，如果采集到的噪声与带噪信号中的噪声足够相似，甚至可以在时域上直接相减。以上是在理想情况下，实际中两个麦克风的位置不同，两路信号之间存在着延迟、不同衰减、干扰，但两路中的噪声成分都来自于同一噪声源，噪声之间仍然具有很强的相关性。利用相关性，采用LMS数字滤波器结合减操作，则可实现自适应噪声对消。自适应噪声对消法适合于平稳的噪声环境，如果噪声是非平稳的则会严重影响其效果。该方法假设噪声与语音是不相关的，若噪声与语音相关，LMS滤波的系数应在语音间歇期间进行刷新，这里需要用到发声活动检测（voice activity detection），增加了方法的复杂度，效果也不够理想。自适应噪声对消法的另一个缺点是会引入音乐噪声。　　2.2 FDM方法　　FDM方法与噪声对消相似，不同的是根据麦克风位置对两路信号进行差分计算，输出更精确的带噪语音信号和参加噪声信号。对得到的两组信号进行自适应噪声对消，得到增强后语音。自适应滤波可能不收敛，这将极大影响增强效果，且收敛速度慢也会使实时增强难以实现。因此，文献利用单通道增强算法代替自适应噪声对消法，带噪语音信号作为单路输入，参考噪声信号作为估计噪声，解决了收敛问题及收敛过程中的噪声泄露问题。　　噪声对消和FDM都是相关去噪，假设噪声和语音是独立不相关的，噪声和噪声之间是相关的。　　3.麦克风阵列语音增强方法　　麦克风阵列语音增强，主要采用阵列信号处理技术进行增强，其中有波束形成（Beamforming）和独立分量分析（ICA，independent component analysis）。波束形成法在20世纪八十年代中期开始被用于语音信号处理。波束形成是空间滤波技术，它从麦克风阵列获得的一组信号中找出一个特定方向的信号，而把其他方向的信号忽略掉。波束形成方法可以分为三种：固定波束形成，自适应波束形成，结合后置滤波（Postfiltering）的波束形成。　　3.1 固定波束形成　　固定波束形成（FB，fixed beamformer）分为延时求和波束形成和滤波求和波束形成，它是因权值或滤波器权重是固定的而得名。固定波束形成由三个模块组成：延时估计模块，延时补偿模块，加权