- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于TDOA麦克风阵列声源方位估计算法研究
基于TDOA麦克风阵列声源方位估计算法研究 【摘 要】利用麦克风阵列进行音频信号方位检测是一个十分活跃的研究领域,在工程应用中也具有重要意义。本文采用相位交换(PHAT)作为加权函数的广义互相关算法(GCC)完成时延差估计,利用到达时延差的算法估计声源方位,并在算法模型的基础上搭建了基于数字信号处理器的四通道声源定位硬件系统平台。 【关键词】麦克风阵列;方位检测;时间延迟估计;数字信号处理 1 音频信号的处理 由于麦克风的阵列接收到的信号是非平稳的,没有经过调制,并且有各种噪声及混响的信号,所以它的信噪比会比较低,时延估计的性能比较差,为此我们对麦克风信号进行了以下的预处理: 1.1 预滤波 麦克风采集到的信号中语音信号是有限带宽信号,其能量主要集中在300-3400Hz之间,而信道噪声和背景噪声则可能分布在整个频谱空间中。因此,算法使用带通滤波器将低频和高频段的噪声滤除,为后续处理提供高信噪比的信号。 1.2 加窗分帧 在处理过程中,为保证语音信号的短时平稳性,对其进行了加窗分帧。我们采用帧与帧互叠的方法,在语音短时平稳允许的时间间隔内,增加可处理的帧数,减少语音分帧处理所造成的不连续性。前一帧和后一帧的交叠部分称为“帧移”,一般情况下,帧移与帧长的比值为 0-1/2。算法中采用的是1/2帧移帧长比。 加窗是用可移动的有限长度窗口进行加权的方法来实现的,也就是用一定的函数w(n)乘以x(n),从而形成加窗的语音信号。在语音信号数字处理中常用的窗函数有汉明窗(Hamming),它的表达式如下所示(N为帧长): w(n)=0.54-0.46cos(2π■),0≤n≤(N-1) 0,n=else (1) 加窗分帧处理完成后,语音信号被分割成一帧一帧平稳的随机短时信号,利用数字信号处理技术,按帧从数据中取出数据进行处理,处理完成后取下一帧,最后便可提取语音的特征参数。 1.3 端点检测 端点检测就是从背景噪声中找出语音的起始点和终止点,根据语音信号的自身特点,本算法采用的是短时能量和短时过零率两种判断标准进行端点检测。 对离散的语音信号x(n)而言,短时能量的定义如下所示: En=∑■■[x(m)w(n-m)]2(2) 表现在信号的第n个点开始加窗函数时的短时能量。如果表示w(n)经过加窗处理后的信号(其中N为窗长),则短时能量可以表示为: En=∑■■x2w(n)(3) 对于离散时间信号,如果相邻的取样值具有不同的代数符号则称之为发生了“过零”。由于语音信号是一种短时平稳的信号,因此在统计平均过零率时以帧为单位来计算,其定义为: zn=■sgn[x(m)]-sgn[x(m-1)]w(n-m)(4) 在实际应用中,过零率常受到A/D转换时的直流偏移、信号中50Hz交流声干扰以及其它噪声的影响。要消除这些干扰一般有两种措施:一种是采用带通滤波器消除信号中的直流分量和50Hz低频分量;另一种方法是使用过门限率来修改过零率,以减少随机噪声的影响。 2 TDOA(Time Different of Arrival)声源方位估计算法 TDOA声源定位算法分为时延差计算和声源定位两步,其中,时延差计算决定其精度。本文采用的是传统广义互相关函数法GCC的一种改进形式。 麦克风阵元的接收信号可表示为: xi(t)=αis(t-τi)+ni(t)(5) 式(5)中s(t)是声源信号,αi是麦克风阵元i接收信号的衰减因子,τi是麦克风阵元i接收信号相对参考麦克风接收信号的时延,ni(t)是麦克风阵元i接收到的加性噪声。 任意两阵元的相关函数可表示为: yij(τij)=■xi(t+τij)xj(t)dt(6) 为减少计算量,我们首先对信号进行FFT变换,其次在频域做两阵元接收信号的相关函数,得到的结果如下式: RxiRxj(τ)=■Xi(f)X*j(f)ej2πτdf(7) 式(7)中X(f)表示麦克风阵元i接收信号的傅里叶变换结果,X*j(f)表示麦克风阵元j接收信号的傅里叶变换结果的共轭。 PHAT-GCC算法是对频域相关函数进行加权,去除互功率谱的幅度信息,减小多径信道的畸变,增强系统对混响的鲁棒性,从而提高峰值尖锐度,以提高时延差估计精度,其加权函数为: ?鬃(f)=■(8) 任意两个麦克风阵元接收信号的时延差就是其相关函数取到最大值时所对应的时间差值。因此,可以通过对式(8)进行峰值搜索,估计出时延差。 本系统采用四个麦克风在二维空间中进行声源定位,主要是增加冗余信息,使得定位的结果更精确。A、O、B、C分别为四个麦克风,其间距为d,点O为阵列基准点,声源为S,当声源位于远场范围时,SA、SO、SB、S
原创力文档


文档评论(0)