- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于N—mode SVDHRTF个人化近似方法
摘 要:本文提出了一种基于N-mode SVD的HRTF个人 化近似方法。HRTF (Head-Related Transfer Function), 即头相关传输函数,描述了声波从声源方位到耳道口的传输 特性,反映了头部、躯干和外耳等身体结构对不同方向声音 信号的滤波效果。本文给出的多重近似方法基于传统独立主 元分析的张量扩展[1]。使用该方法只需测量不同个体的部 分生理参数即可得到该个体的个人化HRTFo
关键词:听觉系统;HRTF;张量;多重线性近似 中图分类号:TP311
头 相关传 输函数 HRTF ( Head-Related Transfer Function)描述了声波从声源到耳道口的传输特性,反映不 同个体的身体结构对不同方向声音信号的滤波效果,是头相 关脉冲响应HRIR的傅里叶变换,它能解释传统的耳间差线 索(双耳时间差和双耳强度差)的声源定位机理,同时还能 解释传统双工理论所不能解释的“混淆锥”问题[2]。
HRTF与特定的声源方位及特定个体的生理结构(头部、 躯体、外耳等结构)有关,如果采用不匹配的HRTF的虚拟 听觉系统,听者由于其本身的HRTF与系统采用的HRTF差异, 容易造成听者的声源定位失真[3]。然而HRTF的测量是一项 耗时且昂贵的工作,对每个个体进行全方位的HRTF测量也 不切实际。因此,从应用的角度考虑,需要寻求个人化HRTF 的近似方法,即通过对受试者的一些结构参数及生理尺寸的 测量,或者通过测量空间少数方向的HRTF数据,通过近似 的方法估计和定制出相应的个人化HRTF。
1 HRTF的张量分解
1. 1张量的基本概念
通常情况下张量[5-7]可以看作为矩阵的扩展,一个向 量可以看成是一阶张量,一个矩阵可以看成二阶张量,有若 干个相同维数矩阵叠放在一起组成立方体形式的数组可以 看作为一个三阶张量。更高阶的张量无法使用可视化直接表 示。灰度图像本质上是一个矩阵[4, 5],视频则是一个三阶 张量。一般情况下,基于向量的算法要把矩阵或者其它阶张 量展开为向量,容易破坏原始数据的空间结构。而基于张量 的算法不需要将张量展开为向量。下面是一些高阶张量运算 定义[6]。
设X为M阶张量,即,其中Ni表示X每阶的维数。X 的某个元素定义为:,其中1 WniWNi, lWiWM。
张量积:设X和Y张量同阶,即,则X和Y的张量积 定义为:
(1)
张量模d矩阵化:模d矩阵化是指将一个M阶张量转 换为一个矩阵。即将张量X转换为,。张量模d矩阵化的 实质就是把张量X的第Nd阶方向的向量提出来,而其它阶 方向的向量置于Nd阶方向的向量的后面形成一个矩阵。
张量压缩:张量压缩通过让两个下标相等并把所有重复 下标的值相加得到。张量压缩可以使张量阶数减2,同时满 足爱因斯坦求和约定。通常情况下,,,张量积的压缩 定义为:
(2)
张量的模d乘:张量的模d乘是张量和矩阵的一种运 算,表示为XXdUo
1. 2 基于 N-mode SVD 的 HRTF 分解
N-mode SVD分解最主要的一个功能是对于目标维度的降 维。传统的PCA降维会影响整个数据的结构,而N-mode SVD 降维可以分别对特定维度进行。
SVD (singular value decomposition)作为传统主元 分析法的拓展,D二U1SU2T,假设D为mXn矩阵,那么U1为 mXm阶酉矩阵;S为mXn阶对角矩阵,其中Sii为D的奇 异值;U2T为nXn阶酉矩阵。使用张量的模d乘可得 D=SX1U1X2U2,对于通用的N-mode SVD可以表示为:
D=zXlUlX2U2XLXnUnXNUN
式中核张量z类似于SVD分解中奇异值张量,Ui表示张 量的特征向量。详细的N-mode SVD分解请参考文献[1]。
2 HRTF多重线性近似
2. 1 HRTF 数据
本文采用加州大学戴维斯分校提供的CIPIC数据库[8], 它提供了 43个真人对象的1250个方位(50个垂直方向,25 个水平方向)的HRIR数据。其空间分辨率约5° o另外CIPCI 数据库还给出了 27个人体参数的测量数据。每个HRIR时长 4. 5ms共200个采样点,经过FFT变换得到HRTF,这里我们 左右耳组合成一个包含左右耳HRTF共400个频率点。
CIPIC数据库中的43个真人受试者其中有8个人的数据 不可获取,故37个受试者的数据可用。对于该37个对象的 人体参数经过DTF的PCA分析选择8个人体参数。最后得出 一个人体参数矩阵作为Uperson初始数据集A。
2. 2 HRTF个人化
使用上述HRTF数据A,定义一个HRTF数据张量,
DSRFXPXD,其中F为DTF频率点数(400), P为CIPI
您可能关注的文档
最近下载
- 2025雨课堂-科研伦理与学术规范概论.docx
- 电气控制与可编程控制器技术(第三版)史国生课后习题答案.docx VIP
- 2025年《黄河保护法》知识考试题库资料300题(含答案).pdf VIP
- 食品贮藏保鲜问答题.doc VIP
- 经典PPT--游戏--emoji表情 猜谜语 .pptx VIP
- 新北师大版小学一年级数学上册期末检测试题(共5套).doc VIP
- 材料设备进场计划及保证措施,主要材料设备用量及采购计划.docx VIP
- 2025陕西中放科技产业发展有限公司招聘(150人)笔试参考题库附答案解析.docx VIP
- 陕2015TJ 026《改性酚醛板(MPF)外墙外保温系统》.pdf VIP
- 材料采购配送采购组织保证措施方案.docx VIP
原创力文档


文档评论(0)