基于自适应注意力机制的图像描述生成方法.pdfVIP

  • 4
  • 0
  • 约1.6万字
  • 约 13页
  • 2023-07-06 发布于四川
  • 举报

基于自适应注意力机制的图像描述生成方法.pdf

基于自适应注意力机制的图像描述生成方法,属于人工智能技术领域。提出一个网格增强模块,引入网格位置之间的相对几何关系来增强网格特征。首先构造基于BERT的语言模型用于提取生成序列的语言信息,接着在transformer的解码器上方构造一个自适应注意力模块,用于在每个单词预测前充分度量视觉信息和语言信息的贡献,来生成更有区分度的图像描述。为证明提出的方法具有通用性,将这两个模型添加到初始的transformer结构上构造RSTNet,并在图像描述的基准数据集MS‑COCO上进行测试。提出的模型在线下

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113837230 A (43)申请公布日 2021.12.24 (21)申请号 202111005878.0 (22)申请日 2021.08.30 (71)申请人 厦门

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档