一种对于单声道声源定位的3D声音定位算法DSP执行器.pptVIP

下载本文档

10
0
约2.73千字
约 21页
2019-02-24 发布于安徽
举报
版权申诉

一种对于单声道声源定位的3D声音定位算法DSP执行器.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

DSP IMPLEMENTATION OF 3D SOUND LOCALIZATION ALGORITHM FOR MONAURAL SOUND SOURCE 这篇论文描述了一个实时的3D声音定位算法.通过使用一个低功耗嵌入式DSP来执行验证。这种执行器的最大不同在于音频被分成了三段，通过分析声音的反射和衍射效应对于不同的媒介来自于一定的声源。在低、中、高三个不同的子频带。3D声音定位的不同方案被设计通过一个IIR滤波器，参数补偿器和comb滤波器。以实现在一个实时的DSP上运行。它是在一个50MHZ的低频下运行的。来保持高质量的声音定位效果。通过一个目标听者测试，这个3D声音定位系统可以用于移动听筒，或者手机等嵌入式设备。最近几年里，在声学信号处理领域里一些复杂的方法已经被使用来实现3D声音作用。主要建立在一个所谓的头相关传递函数（HRTF）基础上的它是受到声源的反射和衍射作用影响的。通常情况下，给定一个声源，3D声音定位可以实现在基于HRTF上从声源到左右耳。一个HRTF特性通常过于复杂对于不同的数字滤波为了有更大的自由度必须在整个过程都改变参数。然而，这个HRTF的方法已经不能胜任一个DSP的实时3D声音定位。为了解决这些困难，这篇论文设计了一个实时3D声音定位算法的DSP执行器。在它上面计算的复杂度被评估去说明这种方法的可行性。最后声音质量被评估由一个目标听者测试。通常的HRTF的3D声音定位系统可以被简单的描述如下：首先，计算必要的HRTF函数，可以通过两个等式来实现。一个是代表给定的声源信号，另一个是表明来自于虚拟头微听筒的声音输出。然后，单声道输入数据被这些HRTF函数处理，最后把结果提供给了输出的立体听筒通常情况下，HRTF的频率响应特性是如此复杂以至于需要大量的数字滤波对于3D声音定位。例如，一个参数补偿器是由大量的数字滤波器组成的。所有的参数包括频率，增益，和质量因子等都要考虑在内。而且，不同的频率响应特性对于左耳右耳都不同，这样就需要很多的不同结构的滤波器。如果都用参数补偿器来实现HRTF，单声道就需要30个补偿器。结果，这种方法还有很多的空间来改变计算复杂性的障碍，为了完成3D声音定位的DSP执行器。为了给出一个新的算法我们首先分析了HRTF函数为了提炼出主要的因素来降低全部的计算复杂性。图1描述了一个HRTF频率响应通过双耳记录在一个右耳的45度角设置声源。通常情况下，通常一个HRTF频率特性可以像图1那样分三个子带，其中低频带特性曲线很平滑的上下改变。在中层的带宽突然的跌破的改变，高频呢是剧烈的震动。因此，在下面一个有效的模拟衍射特性的方案被用于每个频段。 3.1低频带在低频带，从0.1-1.2KHZ的频率，响应在这里很平缓的上下波动。而且在这一阶段左右耳的不同假设音速和头直径是340m/s和150-200mm边界频率是f=v/（2d）=850-1100hz。结果，可以被证明在这个频带里，头部的声音衍射必须被考虑为一个主要的因素。仅仅通过声音容量和延迟在两耳的不同对于定位有很多的影响。为了实现这些参数一个IIR滤波器可以被使用，这个特性可以被构造通过采用一个高通IIR滤波。 3.2高频带现在，我们考虑声音衍射通过人耳，假设人耳是一个圆锥体直径在35-55mm，如果声源半波长比基本直径短的话，这是就必须考虑它对声音衍射的影响了。可以通过一个comb滤波器来估计高频带的频率响应特性 3.3中频带在中频带主要是介于1khz到5khz之间。这里有一些突变的波形在图一中可以看到。因此，3D声音定位可以通过采用参数补偿来执行，对于左右耳在同样的方式，像通常的方法一样。因为这些复杂的特性很难精确的实现用带通滤波器。在这个频率里一个HRTF传函主要是被声音衍射通过头和耳等来影响的。在我们的算法里，PEQs仅仅在中带频段里用到，因此大量的步骤可以被减少。在通常的方法里在低高带里都用到了参数补偿器。我们采用了16位定点DSPTMS320C54x在图二中给出。正如图中所说，这个实时算法的执行程序被分成了三个阶段，第一，分频阶段。第二，声音定位。第三，混合。在这个已经完成的3D定位的例子里，听觉输入数据被分成了左右两个通道，并视听输入数据在时间队列里被一个一个的处理。每个阶段被归纳如下：阶段一，分频：我们的实时算法是从把一个给定的频分音频输入分频开始的。声音被分成低中高三个频带，通过三个三阶低通带通和高通FIR滤波。例如FIR滤波器有一个特性是相位正比于频率。参数被存在了一个DSP的内部存储器。第二阶段，声音定位：3D声音定位调用听觉数据在每一个频带里。在这个阶段里，声源的方向和距离声源的位置在每个频带里被看做听觉数据。在低