摘要
在计算机视觉与自然语言处理领域,图像描述生成任务需要准确识别图像中
的实例与背景并对图像语义进行描述。但是现有的研究在细粒度图像描述任务中
表现不佳,这些方法存在部分实例无法识别、文本之间缺乏词性联系等问题,忽
略了实例与实例、实例与背景间的联系。本文首先对开放词汇条件下细粒度图像
描述生成方法进行研究,通过引入图提示,缓解开放词汇条件下部分实例无法识
别的问题;其次,进一步提出了基于文本视觉增强的细粒度图像描述生成算法,
通过增强文本信息与视觉信息提高模型在细粒度图像描述生成任务上的表现
原创力文档

文档评论(0)