CN119516063A 一种情感增强的数字人驱动与呈现系统及方法 (浙江大学).docxVIP

  • 1
  • 0
  • 约1.43万字
  • 约 24页
  • 2026-05-09 发布于山西
  • 举报

CN119516063A 一种情感增强的数字人驱动与呈现系统及方法 (浙江大学).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119516063A

(43)申请公布日2025.02.25

(21)申请号202510089261.3

(22)申请日2025.01.21

(71)申请人浙江大学

地址310058浙江省杭州市西湖区余杭塘

路866号

(72)发明人耿卫东杨蕾郑烽达厉向东

(74)专利代理机构杭州天勤知识产权代理有限

公司33224

专利代理师曹兆霞

(51)Int.Cl.

G06T13/40(2011.01)

G06F3/01(2006.01)

G10L15/26(2006.01)

G06V40/16(2022.01)

G06V40/20(2022.01)

权利要求书2页说明书8页附图4页

(54)发明名称

一种情感增强的数字人驱动与呈现系统及

方法

(57)摘要

CN119516063A本发明公开了一种情感增强的数字人驱动与呈现系统及方法,属于计算机技术领域,该系统包括音频解耦模块、潜在扩散模型模块、人体运动先验模块、训练模块及渲染图像生成模块,通过语音驱动面部表情和手势动作序列生成,对面部表情和手势动作序列进行预测和重构获得最终的动作序列;基于最终的动作序列生成神经渲染图像。本发明通过语音输入,捕捉到语音中的情感和风格特征,引入交叉注意力特征融合机

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档