- 1
- 0
- 约2.4万字
- 约 19页
- 2024-02-14 发布于四川
- 举报
本发明实施例提供一种基于填充渲染器以及编码器的说话人视觉配音方法及系统。该方法包括:将说话人的多个参考面部图像输入至训练的语义编码器,得到语义潜在编码;利用基于Conformer的参考编码器从语义潜在编码中提取面向于说话人的面部纹理信息;利用音频编码器从配音音频中提取音频潜在编码;利用基于Conformer的运动生成器将面部纹理信息以及音频潜在编码映射处理,得到多个视觉潜在编码;将多个视觉潜在编码输入至训练的填充渲染器,预测出说话人讲述配音音频的多个合成图像;通过多个合成图像以及配音音频生成视觉
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN117557797A
(43)申请公布日2024.02.13
(21)申请号202311435626.0H04N21/81(2011.01)
您可能关注的文档
- 联邦学习的参与者选择与资源分配联合优化方法及系统.pdf
- 游戏技能生成方法、终端设备及计算机可读存储介质.pdf
- 一种聚氯乙烯树脂组合物、制备方法及其应用.pdf
- 一种建筑施工用具有防护功能的升降机.pdf
- 一种多功能电缆沟支架.pdf
- 一种市场主体交易行为规范方法.pdf
- 一种基于锂离子电池过放自动控制的系统.pdf
- 基于高炉煤气加热的焦炉CO2减排工艺、系统以及应用.pdf
- 一种等离子体再生石墨负极的方法及应用.pdf
- 一种射线检测底片烘干装置.pdf
- 河南省许平洛济2026届高三下学期三模英语试题 含答案.docx
- 湖南省九校联盟2026届高三下学期第二次联考(暨怀化市一模)英语试题 含解析.docx
- 湖北省武汉市2026高三下学期3月调研考试化学试题 含答案.docx
- 湖北省武汉市2026高三下学期3月调研考试数学试题 含答案.docx
- 河南省许平洛济2026届高三下学期三模物理试题 含答案.docx
- 2026年山东省公务员考试《申论》(黄河三角洲文化保护主题)真题.docx
- 2026年山东省公务员考试《申论》(文化旅游主题)真题.docx
- 2026年陕西省公务员考试《行政职业能力测验》(B类卷)真题.docx
- 2026年四川省公务员招录《申论》(城乡融合专题)模拟卷.docx
- 2026年浙江省公务员考试《行政职业能力测验》真题解析.docx
最近下载
- 顶叶脑内血肿清除术后护理查房.ppt VIP
- 2025年新疆生产建设兵团事业单位招聘考试公共基础知识试卷.docx VIP
- TB10415--2003铁路桥梁涵工程施工质量验收标准.doc
- 麦当劳CNY营销活动洞察报告.pdf VIP
- 城市社区儿童图书馆空间设计研究——以南昌市为例.pdf VIP
- 基于单片机的家用智能快递柜的设计与实现.doc VIP
- 《初中音乐课堂中歌唱课情景教学的应用-以S中学为例(附问卷)》22000字.docx VIP
- 2026届重庆市西南大学附属中学校高考一模地理试题(解析版).docx VIP
- 基于STM32的便携式心电监护仪.docx VIP
- 冀少版(2024)新教材七年级生物下册《第一章 消化系统与营养摄取》章末测试卷及答案.doc VIP
原创力文档

文档评论(0)