转换等变自监督学习 用于具有最优传输的音高估计.pdfVIP

  • 0
  • 0
  • 约1.88万字
  • 约 4页
  • 2026-03-09 发布于北京
  • 举报

转换等变自监督学习 用于具有最优传输的音高估计.pdf

转换等变自监督学习

用于具有最优传输的音高估计

伯纳多·托雷斯*阿兰·里奥*盖尔·理查德乔夫罗瓦·佩耶斯

长期护理保险,巴黎电信学院,巴黎综合理工学院研究所,法国

*同等工作贡献,联系邮箱:bernardo.torres@telecom-paris.fr

ABSTRACT高变化操作大致相当于简单的平移。

该技术最初在SPICE[9]中提出,其中音高估计

在本文中,我们提出了一维平移等变系统学习的Opti-

器通过最小化标量音高预测之间的等方差目标进行训e

malTransport目标,并展示了其在单音高估计中的适c

练。后来,PESTO[10,14]提出了一个替代的等方差准n

e

用性。我们的方法提供了一个理论上可靠、数值更稳r

则,该准则操作于估计的音高分布上,同时利用了一e

f

定且更为简单的替代方案,用于训练最先进的自监督n

种轻量级变换等方差架构。o

音高估计算法。C

此外,对平移的等方差性不仅限于单一音高估5

本2

计,进一步的工作利用类似原理处理诸如多音高[11]、0

2

译1.介绍

节拍[15,16]、调性[17]和调[18]估计等任务。R

中I

基频估计是音频分析中的核心任务,长期以来在M

1S

v语音和音乐信息检索(MIR)社区中备受关注[1]。它在本文中,我们通过引入一个受OptimalTransportI,

文档评论(0)

1亿VIP精品文档

相关文档