近场声源定位算法的研究.docVIP

下载本文档

66
0
约5.35千字
约 12页
2018-11-07 发布于福建
举报
版权申诉

近场声源定位算法的研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

近场声源定位算法的研究

近场声源定位算法的研究　　摘要：麦克风阵列声源定位可为在复杂环境下的说话人的空间位置估计提供有效的解决方案。而传统的应用于雷达，声呐系统领域的阵列信号处理理论已趋于完美，很多应用于阵列信号处理的算法加以修改就可以用来进行麦克风阵列的声源定位。以阵列信号处理中的经典算法ＭＵＳＩＣ（ＭｕｌｔｉｐｌｅＳｉｇｎａｌＣｌａｓｓｉｆｉｃａｔｉｏｎ）算法为原型，同时根据语音信号在应用中的特点，介绍了一种基于近场的信号模型，并以此为依据对算法进行改进，使声源定位更加精确。对此算法进行了仿真实验，仿真结果表明，此算法具有良好的定位性能，并随着信号信噪比的上升，性能有所提高。　　关键词：　　中图分类号：ＴＮ９１２．３文献标识码：Ａ文章编号：２０９５－２１６３（２０１１）０３－００６９－０３　　ＲｅｓｅａｒｃｈｏｎＳｐｅｅｃｈＬｏｃａｌｉｚａｔｉｏｎｉｎＮｅａｒＦｉｅｌｄ　　ＹＵＸｉａｎｇｌｉ，ＬＶＣｈｅｎｇｇｕｏ　　　　Ａｂｓｔｒａｃｔ： Sound source localization using micrpphone array provides an effective solution to speaker tracking problem under adverse environments.Classical theories about array processing,applied in the field of radar and sonar, are so perfect that they can be used for dealing with microphone array signal processing conveniently only after some revision.In this paper,the algorithm is focused on an arithmetic so-called MUSIC,which is revised according to the characteristics of sound signal as the input of the microphone array.A near-field signal transmission model is introduced in detail for improving the accuracy in sound source localization of the microphone array in near field.Simulation results show the high performance of the localization is gotten. The higher SNR is,The better result is. 　　Ｋｅｙｗｏｒｄｓ：　　　　０引言　　近年来，基于麦克风阵列的声源定位技术快速发展，并且在多媒体系统，移动机器人，视频会议系统等方面有广泛的应用。例如，在军事方面，声源定位技术可以为雷达提供一个很好的补充，不需要发射信号，仅靠接收信号就可以判断目标的位置，因此，在定位的过程中就不会受到干扰和攻击。在视频会议中，说话人跟踪可为主意拾取和摄像机转向控制提供位置信息，使传播的图像和声音更清晰。声源定位技术因为其诸多优点以及在应用上的广泛前景成为了一个研究热点。　　现有的声源定位方法主要分为三类：基于时延估计的定位方法、基于波束形成的定位方法和基于高分辨率空间谱估计的定位方法。基于时延估计的定位方法[１]主要步骤是先进行时间差估计，也就是先计算声源分别到达两个麦克风的时间差，然后根据这个时间差和麦克风阵列的几何结构估计出声源的位置。该类方法的优点是计算量较小，容易实时实现，在单声源定位系统中已经得到广泛应用。基于波束形成的定位方法[２]不需要直接计算时间差，而是通过对目标函数的优化直接实现声源定位。但由于实际的应用环境中，目标函数往往存在多个极值点，因此如何优化复杂峰值的搜索过程就成为了一个重点。基于高分辨率的空间谱估计的声源定位算法，例如宽带的ＭＵＳＩＣ（ＭｕｌｔｉｐｌｅＳｉｇｎａｌＣｌａｓｓｉｆｉｃａｔｉｏｎ）方法[３]和最大似然方法[４]，因其可以同时定位多个声源并且具有比较高的空间分辨率，受到了广泛的关注。　　空间谱估计的方法源于阵列信号处理，其中的多重信号分类（ＭＵＳＩＣ）算法在特定条件下具有很高的估计精度和分辨力，从而吸引了大量的学者对其进行深入的分析与研究。但与阵列信号处理不同的是，在声源定位中，声源在大多数情况下是位于声源近场的。为了解决这一近场问题