到达时差估计的频域模型选读.docx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
到达时差估计的频域模型 Jesper Rindom Jensen1, Jesper Kj?r Nielsen23, Mads Gr?sb?ll Christensen1, S?ren Holdt Jensen3 1Aalborg University 2Bang Olufsen A/S 3Aalborg Universit Audio Analysis Lab, AD:MT Struer, Denmark Dept. of Electronic Systems {jrj,mgc}@create.aau.dk {jkn,shj}@es.aau.dkt 摘 要 到达时差(TDOA)估计是音频信号处理应用中的一类重要问题,以前可以通过互相关方法解决。但本文表明,互相关方法实际上是通用的方法中的一个受约束的特例。因此,本文设置了条件使互相关方法成为统计有效的估算方法。其中一项条件是源信号为基本频率是rad/样本的周期信号,其中是数据点的个数或已知的谐波个数。而更通用的方法只要求源信号具有周期性,因此在对合成数据以及人工延迟的语音信号的估计准确度方面优于互相关方法。仿真代码可在网上获取。 索引词——(分数)到达时差估计,基频估计,广义互相关 引言 在许多应用中,对一个未知信源的角度和位置的估计是一项重要课题。例如,在音频应用中,此类估计可用于区分说话人、抑制非所需的背景噪声和估算房屋的几何结构[1-3]。此类对到达方向和信源位置的估计问题可以归结为估算一个传感器阵列中各个传感器之间的到达时差,文中考虑两个传感器之间的到达时差。传感器对的到达时差估计通常需要将它输入用于处理至少两个扩音器记录的数据的算法(譬如流行的SRP-PHAT算法[1])中 [2]。 目前,在语音应用中计算到达时差估计最广泛应用的方法是基于相关方法的集合,或称广义互相关[4](GCC)方法。与雷达和声呐应用相比,此处的源信号是典型的宽带信号,因此一些对于窄带信号统计有效的算法不能在这直接使用,例如MUSIC[5]和ESPRIT[6]。另外,宽带版MUSIC方法的计算代价[7]比GCC方法的更高,并且当采用快速傅里叶变换算法的GCC方法在频域得以论证后,这类方法能够高效地应用。构建信号频域模型的另一项优势在于可以从源信号中提取延迟参数并将其模拟成连续参数。因此,大多数关于音频应用中的到达方向的估计和信源定位的论文都从频域模型开始研究。 如果考虑最简单的到达时差估计参数模型,则本文的主要观点可以简单阐述。 (1) ,其中信号,和分别为第个传感器信号、源信号和传感器上的噪声。标量,分别是样本源信号从传感器1到2的衰减和相对延迟。如果源信号是一个基频为rad/样本(或其整数倍)的周期信号,则公式(1)中的模型在频域内可写成: (2) ,其中,,分别为是信号,和的离散傅里叶变换系数。公式(2)中的频域模型存在一些问题。首先是局限性太强,虽然音频应用中的信号源通常在较短的时间范围内近似具有周期性,但实际中,该假设在基频上通常难以令人满意,会产生边缘效应[8-10]。通过适当地补零可以避免边缘效应,但是会通过一个秩亏相关矩阵丰富噪声频谱[8]。另一个问题是,由于一个实数源信号中的非整数延迟会产生一个复数的传感器信号,公式(2)中的频域模型没法用于分数TDOA估计! 针对这些问题,本文提出一种不同的模型,假定源信号具有周期性但基频不是rad/样本。将基频模拟成一个未知的参数并联合TDOA和DOA对其估计已经不是新思想[11-15]。然而本文表明,该模型比传统频域模型更具广泛性,因为后者是前者的一个特例。本文还设立了条件使互相关方法成为统计有效的估计方法。由此,本文为联合基频和到达时差估计提出了一种新型的近似最大似然估计方法,在处理合成数据和人工延迟的声音数据方面的性能均优于互相关方法。相比于传统互相关算法,该估计方法无需使用内插方法就能产生分数延迟估值。 联合基频与到达时差估计 正如引言中所提到的,本文不对基频信号的模型做任何假设。如下文中详述,本文假定源信号是具有一个未知基频和数量未知的谐波成分的周期性信号。本文还假定噪声为高斯白噪声。尽管可能导致对大混响音频的估计性能不佳,这些假设已经足以论证本文的主要观点。 2.1. 模型 任意一个平均值为0的实数周期性源信号可以写成 (3) 其中,,,分别是幅度、相位、基频和复振幅。记,相当于实际中源信号无直流分量。如果将源信号延迟,得 (4) 此处定义。公式(1)中的信号模型可写成矩阵向量形

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档