- 25
- 0
- 约1.32万字
- 约 11页
- 2023-06-20 发布于四川
- 举报
本发明公开了一种基于情感类别标签的可控情感语音合成系统及方法,该方法包括:文本特征提取步骤,用于从输入的音素序列中提取出语音文本特征;语音风格特征提取步骤,用于接收与音素序列对应的目标语音的声学特征,并从声学特征中提取出语音风格特征;语音风格特征记忆步骤,用于根据语音风格特征得到目标语音的情感风格特征;声学特征预测步骤,用于根据语音文本特征和情感风格特征预测合成情感语音声学特征。本发明可提高语音风格特征与语音文本特征的解耦程度,使得合成语音的风格调控结果不受文本内容限制,提升合成语音的可控性和灵
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113327572 A
(43)申请公布日 2021.08.31
(21)申请号 202110612224.8
(22)申请日 2021.06.02
(71)申请人 清华大学深圳国际研究生院
您可能关注的文档
最近下载
- 高一物理期中考试试题及答案.docx VIP
- 基于大数据的心理健康评估.docx VIP
- 医疗影像智能诊断.docx VIP
- 陶瓷膜的制备与水处理.pptx VIP
- (高清版)-B-T 34590.6-2022 道路车辆 功能安全 第6部分:产品开发:软件层面.pdf VIP
- 智能医疗影像分析系统开发与应用.docx VIP
- Axio-Imager-M2显微镜使用手册.ppt VIP
- 2025至2030中国热电材料行业市场深度调研及竞争格局及有效策略与实施路径评估报告.docx VIP
- T_CSGPC 033-2024 陆上风电场设施变形测量技术规程.docx
- 93K测试机异常处理.docx VIP
原创力文档

文档评论(0)