- 20
- 0
- 约2.5万字
- 约 21页
- 2024-04-10 发布于四川
- 举报
本发明基于文本驱动的端到端的3D人脸快速生成与编辑方法,在3D人脸生成过程中采用文本到视觉的直接映射,将映射后的文本特征与噪声相加后,得到具有文本信息的风格隐码,该风格隐码同时调控负责三维特征建模的NeRF块和二维特征上采样的卷积层,从而将文本控制条件加入到整个3D人脸的生成过程中。为了提高生成人脸与文本的匹配一致性,本发明设计了风格隐码增强器,利用文本局部特征与当前的视觉特征进行融合,在不同的生成阶段对风格隐码进行调控。模型训练时在3D空间中引入几何正则项,在3D空间对生成的人脸进行低级几何属
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN117853638A
(43)申请公布日2024.04.09
(21)申请号202410257189.6
(22)申请日2024.03.07
(71)申请人厦门大学
原创力文档

文档评论(0)