GSVDspeech文献阅读.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GSVDspeech文献阅读

基于GSVD最优滤波单和麦克风语音增强 广义奇异值分解(GSVD)算法为基础,有色噪声语音信号。这GSVD的多麦克风算法可以被认为是单麦克风信号子空间算法的扩展一个特定的最优滤波问题。器可写语音数据矩阵和噪声数据矩阵的广义奇异向量和奇异值的函数。单麦克风和的最优滤波器得到一些对称性质,白噪声的情况下有色噪声情况下有效的。此外,一些单麦克风的信号子空间算法的平均步,,这个平均操作是不必要的,甚至是。对于简单的情况下,源和多径传播基于GSVD技术具有方向性波束形成的空间格局。当比较现实情况的降噪性能,仿真结果表明基于GSVD技术所有的混响时间比标准的固定和自适应波束形成技术具有更好的性能,,例如,遇到未校准麦克风阵列它。. 这主要是由于这一事实,扬声器位于从一定距离的录音麦克风,使麦克风记录以及噪声源。一般来说,背景噪音声是宽带和非平稳信号,信号噪声比(SNR),麦克风的信可以是相当低(跌0分贝)。背景噪音导致信号衰减,这可以导致总不清晰度的讲话和大幅度降低了语音编码的性能和自动语音识别系统。因此,高效降噪算法是必需的。 在过去的几十年中,单麦克风语音增强算法已引起了人们极大的兴趣。单麦克风语音增强算法大致可分为参数技术和非带参数技术。参数技术模型是嵌入在高斯噪声中的一个随机的语音信号自回归(AR)模型。语音增强过程大致包括估算语音的AR参数和对噪声信号应用(非因果)维纳滤波器[1] [2]或卡尔曼滤波[3] [4],其中最优滤波器是在估计的AR参数的基础上进行的。非参数技术不估计语音参数,并且需要一个跨噪音指纹表单域(主要是DFT或康莱特域),它是用来在语音和噪声期间获得的估计清晰的语音信号。知名的非参数技术包括谱减法[5] [6]和信号子空间的基技术。 最近几个以信号子空间为基础的针对有色噪声的单一的麦克风语音增强技术被提出。这些技术是基于(广义)的奇异值分解(SVD)[7] - [10],卡亨南 - 拉维变换(康莱特)[11] - [14]。其主要思想是把一个立体的噪声信号作为M维空间向量,然后把这个空间分隔成两个正交子空间:一是信号加噪子空间(小于M维,与纯净信号对应),二是噪声子空间,即信号加噪子空间的正交补。当然,如果纯净的信号可用低秩模型建模,这种分离是唯一可能的。这种模型常常能使语音纯净[15],[16]。信号增强是通过消除噪声子空间和从剩余的信号加噪声子空间估计纯净语音信号来完成的。根据特定的优化准则,不同的估计可以得到纯净语音信号。 基于信号子空间的单麦克风讲话增强根据噪声可能(白噪声和有色噪声)可分为估计型(最小平方和,最小方差,感知有关标准),加工型(自适应块),还有就是根据是否列入额外的平均步。对于所有技术,由此产生的滤波矩阵可以写成所谓的语音和噪声数据矩阵的(广义)奇异向量和奇异的值函数。 Dendrinos等人 [7]认为假设白噪声通过删除最小的奇异值对Toeplitz算子结构的语音数据矩阵采用最小二乘估计,然后通过求降秩矩阵对角元素的算术平均值以恢复Toeplitz结构。Jensen等 [8] 使用商奇异值分解(QSVD)将其扩展到有色噪声情况下,其中包括隐含的白化噪声。他们对Toeplitz矩阵结构的语音数据矩阵做最小方差(MV)估计并求其对角元素的平均值。在白噪声的情况下,以法莲和范树[11]引入了两个感知相关估计标准,保持最小的信号失真同时使残余噪声能量低于某个给定的阈值。他们没有使用额外的平均步。黄,赵[12]略作修改此过程。他们通过增加能量约束使得增强信号的短时能量和清晰语音的短时能量估计相匹配。米塔尔和Phamdo[13]扩展了以法莲和范树的算法,在色噪声情况下不使用白化以区别语音处理和噪声帧处理。Rezayee和Gazor[14] 减少了信号子空间语音增强算法的计算复杂度。它是基于增强技术使用KTL算法,即紧缩的投影逼近子空间跟踪(PAST) 算法[17]。所有的学者都声称基于信号子空间算法比起谱减法算法有更好的语音可懂成度和/或语音识别果。 然而,所有的单麦克风语音增强技术只使用在当前时间频率信息信号,因此可以被视为(信号自适应)频率嘈杂的语音信号的频率滤波[18]。这种过滤操作可以理解为对最重要的共振峰的语音信号的自适应提取,从而减少他的噪音量。 在许多应用,如移动电话免提和助听器,时下多个麦克风用于录制和加强含噪语音信号。当多个麦克风可用时,可以利用语音和噪声源的频率和信号空间, 从而在一个过程中结合时空信息。有些作者已经使用基于信号子空间算法用于多通道信号的处理。汉森[9]建议分别对每个麦克风信号使用单通道子空间的语音 增强算法,随之延迟和波束形成。 jabloun和Chamagne[19]利用的多麦克风信息设计(单声道)信号子空间后过滤,继而延和波束形成

文档评论(0)

xjj2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档