一种基于矫正流模型的高质量语音合成方法.pdfVIP

  • 0
  • 0
  • 约1.81万字
  • 约 15页
  • 2023-12-28 发布于四川
  • 举报

一种基于矫正流模型的高质量语音合成方法.pdf

本申请提供了一种基于矫正流模型的高质量语音合成方法,基于RK45ODESolver进行采样时能够得到较好的音频生成质量,和大多数现存的基于扩散的语音合成模型相比,在使用EulerODESolver进行一步采样时也能够得到很好的音频生成质量,而且整个训练过程是简单有效的,也不需要预先训练一个教师模型得到更好的音频质量,显著提高了真实场景中的高质量语音合成的可用性。

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN117292672A

(43)申请公布日2023.12.26

(21)申请号202311587465.7

(22)申请日2023.11.27

(71)申请人厦门大学

地址361000

文档评论(0)

1亿VIP精品文档

相关文档