- 0
- 0
- 约1.88万字
- 约 4页
- 2026-03-09 发布于北京
- 举报
转换等变自监督学习
用于具有最优传输的音高估计
伯纳多·托雷斯*阿兰·里奥*盖尔·理查德乔夫罗瓦·佩耶斯
长期护理保险,巴黎电信学院,巴黎综合理工学院研究所,法国
*同等工作贡献,联系邮箱:bernardo.torres@telecom-paris.fr
ABSTRACT高变化操作大致相当于简单的平移。
该技术最初在SPICE[9]中提出,其中音高估计
在本文中,我们提出了一维平移等变系统学习的Opti-
器通过最小化标量音高预测之间的等方差目标进行训e
malTransport目标,并展示了其在单音高估计中的适c
练。后来,PESTO[10,14]提出了一个替代的等方差准n
e
用性。我们的方法提供了一个理论上可靠、数值更稳r
则,该准则操作于估计的音高分布上,同时利用了一e
f
定且更为简单的替代方案,用于训练最先进的自监督n
种轻量级变换等方差架构。o
音高估计算法。C
此外,对平移的等方差性不仅限于单一音高估5
本2
计,进一步的工作利用类似原理处理诸如多音高[11]、0
2
译1.介绍
节拍[15,16]、调性[17]和调[18]估计等任务。R
中I
基频估计是音频分析中的核心任务,长期以来在M
1S
v语音和音乐信息检索(MIR)社区中备受关注[1]。它在本文中,我们通过引入一个受OptimalTransportI,
原创力文档

文档评论(0)