子带t分布的快速独立向量分析在语声盲源分离中的应用∗.docxVIP

子带t分布的快速独立向量分析在语声盲源分离中的应用∗.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
? ? 子带t分布的快速独立向量分析在语声盲源分离中的应用? ? ? 康 坊 杨飞然 杨 军 (1 中国科学院声学研究所 北京 100190) (2 中国科学院大学 北京 100049) 0 引言 盲源分离(Blind source separation, BSS)旨在将感兴趣的信号从混合信号当中分离出来,可广泛应用于声频信号处理领域,其中一个重要应用是语声分离。相较于有监督的分离算法[1],BSS 可以在没有任何传输信道信息和声源先验信息的情况下从卷积混合的观测信号中无监督地分离出原始声源。频域独立成分分析(Independent component analysis, ICA)[2?5]作为解决卷积BSS 问题的一类广泛且经典的方法,需要在各个频点上独立建模并独立分离源信号的各个频率成分,因此无法确保不同频点间声源顺序的一致性,即存在顺序模糊性问题。独立向量分析(Independent vector analysis, IVA)[6]以及其改进的辅助函数IVA(Auxiliaryfunction IVA, AuxIVA)[7]通过在全频带建立球对称联合概率密度函数,使得同一声源的各频率成分具有统一的频间依赖性,有效地减轻了顺序模糊性问题,提高了分离性能。然而,统一的频间依赖假设导致声源模型缺少灵活性,可能导致子带间出现顺序错排的问题。为了更好地表征声频信号中相近频点或谐波频点的依赖性要强于较远频点的特点,基于子带依赖性假设的声源模型[8?10]被提出以用于增强相关频点、弱化不相关频点的依赖性。此外,为了提高AuxIVA 算法的收敛速度和稳定性,改进的快速迭代IVA(本文简称Fast AuxIVA)算法[11]通过秩1 更新的方式来估计分离信号,避免估计分离滤波器带来的矩阵求逆,降低计算复杂度和数值不稳定性,但并未提升分离性能。 为了进一步提升IVA 算法在语声分离任务中的分离性能和稳定性,本文提出一种基于子带声源模型的快速IVA 算法,并采用更适合语声信号重尾特性的t分布[12]作为声源概率密度函数。该算法首先根据信号特性将全频带划分为多个子带,其中包含一个重叠子带,在各个子带内假设声源服从联合t 分布,由于子带间的重叠设置使得各个子带间依然具有频间依赖性。此外,该算法将声源模型联合秩1 更新方法,推导出新的空间模型参数优化准则,在基于子带t 分布的声源模型下实现混合语声信号的快速分离。实验结果表明,本文提出的算法能够在少量的迭代次数下取得比目前已有的IVA 算法更好的语声分离性能。 1 快速AuxIVA算法 1.1 混合和分离模型 假设正定BSS 中N个声源信号由N个传声器信号接收,声源信号、估计的声源信号以及观测信号的频域复数表示分别为 其中,i= 1,2,··· ,I为频率索引(I为频点数),j= 1,2,··· ,J为时间索引(J是帧数),(·)T表示矩阵转置。经过短时傅里叶变换(Short-time Fourier transform, STFT)后,时域卷积混合模型可以变换到频域瞬时混合模型, 其中,Ai是N ×N的混合矩阵。当Ai可逆时,混合矩阵Wi=(wi1,wi2,··· ,wiN)H可以被定义成Ai的逆矩阵,因此分离信号yij可以通过以下公式恢复得到, 其中,wi,n=(wi,n1,wi,n2,··· ,wi,nN)T是第n个声源的分离向量,(·)H表示矩阵共轭转置。 1.2 声源估计的快速迭代算法 在IVA 中,根据式(5)以及声源间的独立性假设,观测信号xij在所有时间帧上的负对数似然函数可表示为 其中,G(yj,n)=?logp(yj,n)为对比函数。在超高斯假设下,声源的概率密度函数p(yj,n)可表示为 其中,G(·)需要满足φ(r)=G′(r)/(2r)在r 0 时单调递减,(·)′表示微分。分离矩阵Wi可以通过最小化式(6)中的目标函数得到,进而估计出分离信号yij。 为了更快更稳定地优化分离矩阵,AuxIVA 算法构建辅助目标函数Q()代替直接求解 其中,Vi,n是辅助变量。 通过不断最小化Q()和更新辅助变量Vi,n来逼近原函数的最优解,因此得到以下迭代准则: 其中,en是第n个元素为1 的单位向量。上述迭代准则适用于多种声源模型,但需要在每次迭代时计算N个辅助变量矩阵和N个矩阵的逆。此外,当矩阵病态时,求逆操作在迭代过程中可能导致数值不稳定。 为了避免矩阵求逆,降低计算复杂度,文献[11]提出一种秩1更新的方式来优化Wi, 其中,vi,n=(vi,n1,vi,n1,··· ,vi,nN)T是待估计的优化向量。将式(13)代入辅助函数Q得到 最小化上述目标函数可得到vi,n的优化准则, 根据式(13),得到yij新的计算公式: 因此分离信号的估计不需要计算分离矩阵Wi,与迭代过

文档评论(0)

布丁文库 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体 重庆微铭汇信息技术有限公司
IP属地上海
统一社会信用代码/组织机构代码
91500108305191485W

1亿VIP精品文档

相关文档