声道时差算法在安防辅助定位中应用.docVIP

下载本文档

3
0
约4.17千字
约 10页
2018-08-31 发布于福建
举报
版权申诉

声道时差算法在安防辅助定位中应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

声道时差算法在安防辅助定位中应用

声道时差算法在安防辅助定位中应用　　摘　要:随着科技的进步,安防监控系统越来越向自动化监控的方向发展,本文给出了一种使用音频辅助视频跟踪的监控定位方案,能够互补视频跟踪与音频跟踪的优缺点,达到很好的跟踪效果。文中还给出了一种音频定位的方法,通过滤波算法,模板提取算法,模板匹配算法等综合而成的声道时差算法,来定位声源所在的角度,从而控制摄像头转向目标所在方向,进而继续精度更高的视频跟踪。　　关键词:跟踪　音频定位　声道时差　模板提取　模板匹配　　　　0　引言　　　　随着我国经济建设的发展,安防设备的需求日益增加。尤其是具有跟踪功能的视频、音频安防系统在很多关键场合发挥着重要的作用。在安防跟踪系统中,视频跟踪系统起到主导的作用。但是,在监控区域相对广阔的场合,适当的使用音频跟踪作为视频跟踪的辅助可以大大地降低设备的需求数量,降低成本,同时提供更好的监控跟踪效果。在相对广阔的区域,可以使用具有音频辅助的视频跟踪系统。音频系统首先定位目标的方向,同时启动视频跟踪系统捕捉目标。一旦视频跟踪系统捕获目标的影响,后续跟踪工作交由视频系统完成。视频跟踪系统的算法已经相对成熟,而音频辅助系统的算法尚存在一些问题。下面我们就常用的音频跟踪算法进行简单分析,并阐明声道时差算法在辅助跟踪系统中的应用。　　　　1　音频定位算法简介　　　　音频定位算法与视频跟踪算法有所不同,它们各有各的优势与劣势　　1.1　视频跟踪算法精确度高,可以保持物体始终在监控范围中央,但计算量大,可控范围小。　　1.2　音频跟踪算法精确度低,只能检测物体所在的各个轴方位的角度,但计算量相对小,可以实时计算,可控范围很大,可以作为辅助跟踪系统。　　1.3　综上所述,如果采用音频定位辅助视频跟踪的系统可以互补视频与音频跟踪的优缺点,可以使用音频定位不在摄像头监控范围的目标,并且在目标进入监控范围内,使用精度较高的视频跟踪继续跟踪目标,达到综合跟踪的效果。　　音频定位算法目前有基于最大输出功率的可控波束形成技术,高分辨率谱估计技术,基于声压幅度比的定位技术以及基于声音到达时间差(T1me Difference of Arrival,TDOA)的定位技术。　　TDOA技术,是使用同一信号到达不同麦克风的时间差,与两个麦克风的距离差,计算出目标在两个麦克风之间的方位角,得出目标的相应位置。　　TDOA技术中最关键的步骤是计算信号到达麦克风的时间差,目前广义互相关(GCC)算法是精确度很高的计算方法,且易于理解,但耗时较长。　　　　2　广义互相关(GCC)时延估计算法　　　　广义互相关时延估计算法是从基本相关算法演变而来。而基本相关算法的精髓是,根据两个信号的互相关函数的峰值,其峰值所在的点就是两个麦克风的时间差。而广义互相关时延估计算法会对两个信号进行预滤波,然后再求互相关函数并找其峰值点,这样会更准确的找到峰值点所在的位置,因为预滤波会避免互相关函数的主极峰平坦的情况,提高时延估计精度。　　　　3　声道时差算法　　　　虽然广义互相关时延估计算法实现简单,准确率很好,但是由于需要进行FFT变换和IFFT变换,时间复杂度比较高,而且为了能够获得更好的精度,采样点数要尽量的多,致使时间复杂度更高,因此本文提出一种声道时延搜索算法。　　声道时延搜索算法的基本思想是,当得到一段立体声音频信号的时候,由于声源与两个麦克风距离不同,则同一段声音数据到达两个麦克风的时间也不同,表现为左右声道的相位偏差,根据这个时间就能得到声源与两个麦克风的角度,即物体所在的位置。因此,左右声道的相位差是主要突破点,它可以近似转换成得到左右声道的离散数据,在数组中的索引值产生的偏差。例如声源在两个麦克的靠右的方向,声音到达左声道的时间就会相对右声道有延迟,在离散数据中会表现为左声道的数据索引比相对应的右声道数据的索引要大,然后根据索引的差值,转换成麦克风的相位差,进而转换成声源所在的角度。因此算法的关键是找到同一信息在左右声道的索引值,但是想找到完全匹配的数据信息很难,因为由于随机噪声的影响和两个麦克风的差异,因此造成完全匹配几乎不可能实现,为算法的实现增加了难度和不确定性。　　受到视频跟踪算法中的一些图像处理分析算法的启发,音频信号也采用类似的几个算法步骤,同样也能得到需要的结果。假设左声道比右声道索引偏移了t,那么将左声道序列移动t后,与右声道序列进行安位求差值,再将差值求和,那么得出的这个值应该是一个很小的值。因此找到得到最小值时的偏移量t,就是需要得到的左右声道的偏差值。但是每次求取不同t值的差值和时,计算量都是相当大的,而且信号的边界值也是没有意义的值,为了克服这个缺点,我定义了声道的模板,即声道中的部分