预训练图像文本模型处理方法和图文检索系统.pdfVIP

  • 2
  • 0
  • 约2.07万字
  • 约 17页
  • 2023-05-17 发布于四川
  • 举报

预训练图像文本模型处理方法和图文检索系统.pdf

本发明公开了一种预训练图像文本模型处理方法和图文检索系统。所述方法包括:获取对图像文本样本对中的字和图像块进行掩码处理的掩码训练样本对;将掩码训练样本对输入预训练图像文本模型,获取针对被掩码字、被掩码图像块和图像文本任务输出的损失值,其中,预训练图像文本模型包括多级下采样编码器和多级上采样解码器;以及根据损失值,调整所述预训练图像文本模型中的参数。本发明通过图像的分块嵌入化结合多级下采样编码器和逐级对应的上采样解码器的模型结构实现了预训练图像语言网络中被掩码图像块的像素级重建。进一步地,将实现输

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114821223 A (43)申请公布日 2022.07.29 (21)申请号 202210327383.8 (22)申请日 2022.03.30 (71)申请人 阿里巴巴(中国)有限公司 地址 3

文档评论(0)

1亿VIP精品文档

相关文档