- 3
- 0
- 约1.54万字
- 约 13页
- 2023-08-02 发布于四川
- 举报
本发明涉及一种基于张量辐射场的3D数字人动态说话人脸生成方法及系统,包括:输入源视频,其中,源视频含有一段有人物说话的视频内容;对源视频进行特征提取,得到与人物相对应的姿态特征、音频特征和表情特征;将姿态特征、音频特征和表情特征合并为总特征;根据源视频生成与人物相对应的三维坐标信息;将总特征和三维坐标信息输入至动态张量辐射场进行张量分解;进行张量重建,并输出与人物相对应的动态说话人脸。本发明利用TensoRF搭建一个基于动态张量辐射场快速训练的3D说话人脸生成模型,可以在耗时较短的情况下生成高质
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 116524082 A
(43)申请公布日 2023.08.01
(21)申请号 202310194817.6
(22)申请日 2023.03.02
(71)申请人 上海学深智能科技有限公司
地址
原创力文档

文档评论(0)