基于麦克风阵列的移动机器人听觉定位方法分析-analysis of auditory localization method of mobile robot based on microphone array.docx

下载文档 降价啦

3
0
约3.94万字
约 66页
2018-05-28 发布于上海
举报
版权申诉
保障服务

基于麦克风阵列的移动机器人听觉定位方法分析-analysis of auditory localization method of mobile robot based on microphone array.docx

1、本文档共66页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于麦克风阵列的移动机器人听觉定位方法分析-analysis of auditory localization method of mobile robot based on microphone array

第一章绪论§1-1机器人声源定位的研究背景和现状1-1-1机器人声源定位的研究背景在二十一世纪，机器人技术突飞猛进，机器人的应用也慢慢从传统的工业领域渗透到航空、医学、服务等领域。在这些应用中，对于复杂环境下自主移动机器人要完成艰巨的任务，必须拥有精确的感知能力、可靠的导航系统、和高度的适应能力。而移动机器人导航技术作为智能机器人领域的一个重要研究方向，在一定程度上依赖于机器人感知技术的发展，并在此基础上解决机器人“在何处、去何处、如何去”的问题。其中“去何处”则是机器人执行导航任务的根本前提——目标定位问题。多年来，国内外许多研究机构都致力于这方面的研究。20世纪70年代，视觉导航技术被广泛应用于移动机器人目标定位中。该技术探测的信号范围宽、获取的信息完整且空间分辨率较高。然而机器人视觉的感知范围往往只能在其前方180度以内，当目标超出视野范围，尤其是物体被阻挡或环境能见度较低时，这种识别方式就会失效。而声音则具有时间分辨率高、无方向性和不受能见度限制等优点，因此利用上述性质开发新型的听觉传感器，用于移动机器人目标定位中，可以弥补视觉传感器的局限性，这是一个创新，具有重要的理论意义和应用价值。听觉系统，作为人类感官的重要组成部分，已经成为机器人研究领域的重要研究对象。目前的声音探测技术通过声纳传感器等一些装置并结合声学理论，得到声音的传播信号，来对目标进行定位和跟踪。机器人的耳朵是模仿人类的听觉原理，是一个重要的感知器官，是接受声音信号的重要装置。机器人的智能化的重要标准之一就是其听觉，听觉是人机交互，传达信息的重要途径。在外界环境已知甚至未知的情况下，自主定位导航是我们研究机器人的基本所在。机器人由本身安装的里程计、激光、视觉等一些传感器自主地感知外界环境，完成自定位、目标定位和壁障、跟踪等任务。其作用意义重大。目前，机器人主要靠视觉，并配合以超声测距仪等多传感器信息融合的导航方式来解决此类问题。机器人上安装有视觉或超声传感器，对机器人当时所处的有限的局部环境做出判断分析。但由于光和超声波的波长都比较小，其在传输中的衍射能力相对很弱，因而很难对障碍物后面的路径情况做出判断。而声波的波长较大，具有较强的衍射能力，可以绕过障碍物传播，利用声音的这种绕射及其反射传播等特性，在机器人多信息采集系统中，听觉可以与机器人视觉相配合弥补其视觉有限性及不能穿过非透光障碍物的局限性。同时，对人类听觉系统的模拟和研究，也从一方面表明了人类对自身听觉生理能力的探知程度，是人类对自身的求索和发展。人类所获取外界信息的一种非常重要的途径就是声音的传播。不同的物体发出的声音不同，人们根据声音判断物体相对于自己的位置。在某些特定的复杂的场合，人们依靠机器人来确定声音，声源定位技术就体现于此。声源定位技术是利用声学和电子装置接收声音信号，配合数字信号处理技术加以分析和处理，来确定和跟踪自然声源或人为声源的空间位置的一种技术。它能够用在视频会议、电话会议等系统中，进而引导麦克风阵列波束和摄像头的方向朝向说话人；也适合在强混响环境下拾取声音、记录大型场所的会议，提高声音拾取的质量；还能够对语音识别软件进行前端预处理，以提高声音信号的质量，提高语音识别软件的分辨率；还可用于助听装置中，更好地为耳障患者服务：因此具有较高的应用价值和广阔的发展前景，值得进行研究探讨[1]。1-1-2声源定位的研究现状传感器阵列信号处理技术的发展突飞猛进，并且已在雷达、声纳、通信、医学及航空航天技术等诸多领域得到广泛应用。上世纪八十年代，Flanagan将麦克风阵列引入到大型会议的语音增强应用中，并开发出很多实际产品。之后Silverman将麦克风阵列引入到语音识别系统。1992年，Silverman又将阵列信号处理技术用于移动环境下的语音获取，后来将其应用于说话人识别。1995年Flanagan在混响环境下用阵列信号处理技术来拾取声音。1996年Silverman和Brandstein又将其应用于语音识别和声源定位中。近几年来，基于麦克风阵列的语音信号处理技术已成为一个新的研究热点，具有广泛的实际意义和应用前景。国际上经过多年的研究，声源定位算法已经比较的成熟。国外很多著名的大型研究机构和公司正致力于研究麦克风阵列和产品的开发，有的已经进入应用阶段，包括可视电话、电话会议系统、视频会议系统。还有语音识别软件的前端预处理，大型场所的会议记录和助听装置，强噪声环境下的语音获取，车载系统环境等；军事上包括声纳传感器对水下潜艇的跟踪和无源定位飞机及一些其他的发声设备上。很多国外著名的研究机构和公司（例如BELL、IBM），以研发出麦克风阵列的产品，有一些已经进入市场。其中，文献[2]中就使用了由24个麦克风组成的麦克风阵列。文献[3]不仅能对单个静止声源定位，而且还对多声源的定位问题进行