CN119516054A 一种基于大模型可学习文本潜码的说话数字人生成方法 (电子科技大学).docxVIP

  • 2
  • 0
  • 约1.89万字
  • 约 28页
  • 2026-05-09 发布于山西
  • 举报

CN119516054A 一种基于大模型可学习文本潜码的说话数字人生成方法 (电子科技大学).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119516054A

(43)申请公布日2025.02.25

(21)申请号202411540741.9

(22)申请日2024.10.31

(71)申请人电子科技大学

地址611731四川省成都市高新区(西区)

西源大道2006号

(72)发明人位纪伟刘科袁瑞淇柴瑞坤何仕远周雨阳杨阳

(74)专利代理机构成都行之专利代理有限公司51220

专利代理师温利平

(51)Int.Cl.

G06T13/40(2011.01)

G06V10/80(2022.01)

G06V10/82(2022.01)

G06V20/40(2022.01)

G06V40/16(2022.01)

G06V40/70(2022.01)

G06N3/045(2023.01)

G06N3/0475(2023.01)

权利要求书4页说明书9页附图2页

(54)发明名称

一种基于大模型可学习文本潜码的说话数

字人生成方法

(57)摘要

CN119516054A本发明公开了一种基于大模型可学习文本潜码的说话数字人生成方法,根据实际需要获取若干人脸语音视频并提取训练样本构成训练样本集,每个训练样本包括参考视频和所对应的梅尔频谱图序列、嘴部参考图像;构建基于可

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档