- 0
- 0
- 约1.81万字
- 约 15页
- 2023-12-28 发布于四川
- 举报
本申请提供了一种基于矫正流模型的高质量语音合成方法,基于RK45ODESolver进行采样时能够得到较好的音频生成质量,和大多数现存的基于扩散的语音合成模型相比,在使用EulerODESolver进行一步采样时也能够得到很好的音频生成质量,而且整个训练过程是简单有效的,也不需要预先训练一个教师模型得到更好的音频质量,显著提高了真实场景中的高质量语音合成的可用性。
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN117292672A
(43)申请公布日2023.12.26
(21)申请号202311587465.7
(22)申请日2023.11.27
(71)申请人厦门大学
地址361000
您可能关注的文档
最近下载
- 《db44t402.1-2007-燃气热水器(给)排气管》.pdf VIP
- 5、灰色色母MSDS 物质安全表.pdf VIP
- 2020.2021一汽大众全新迈腾维修手册电路图 正时链条装配.pdf VIP
- (2025)西宁市入团考试精选题库(含答案).docx VIP
- 2026年陕西省铜川市政府采购评审专家考试真题(带答案).docx VIP
- 《铁路轨道维护》课件——更换道岔基本轨作业.pptx VIP
- 深圳市工务署参考品牌库(2021.12).docx VIP
- QC-T 656-2023汽车空调用空气调节装置总成.pdf VIP
- 肌少症膳食营养处方及运动干预中国专家共识(2025)解读PPT课件.pptx VIP
- 南京信息工程大学《大学物理》期末试卷a卷.pdf VIP
原创力文档

文档评论(0)