一种知识驱动型的文本到图像生成方法.pdfVIP

  • 6
  • 0
  • 约1.75万字
  • 约 13页
  • 2023-07-06 发布于四川
  • 举报

一种知识驱动型的文本到图像生成方法.pdf

一种知识驱动型的文本到图像生成方法,属于图像生成技术领域。在基于特定自然语言描述生成图像的过程中引入视觉知识库,提供视觉先验知识,指导生成与自然语言描述相符的图像。图像生成模型将以Query‑Key‑Value的形式从视觉知识库中查询与描述文本相关的视觉特征,作为图像生成的先验知识。为充分利用先验知识,提供两种新的相关知识读取方式:弱读取和强读取。设计一种新的语义一致性度量标准“伪图灵测试”。不同多媒体任务的“专家”直接或间接地评估合成图像与给定的自然语言描述之间的语义一致性程度。提高生成的图像

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113837229 A (43)申请公布日 2021.12.24 (21)申请号 202111005846.0 (22)申请日 2021.08.30 (71)申请人 厦门

文档评论(0)

1亿VIP精品文档

相关文档