面向长尾效应的场景图生成方法研究.pdf

标题面向长尾效应的场景图生成方法研究摘要主要内容1图像作为一种信息的载体,相较于文本具有更加直观清楚的视觉信息2图像中的丰富视觉信息以语义方式提取和表示将有助于视觉的下游任务3环境图生成主要通过目标检测模块提取出一张图像中实体和实体间关系的三元组形式,即主语关系和宾语,构建语义结构化表示4目标检测模块在每小批实体对样本的训练过程中,利用训练样本的先验关系频率信息,自适应地对全连接分类器权重进行调整,避免模型全连接分类器的过拟合现象,从而缓解场景图生成

中文摘要

图像作为信息的载体之一,相对于文字具有更加直观清楚的视觉信息。图像中

丰富的视觉信息以语义方式提取和表示将有利于视觉的下游任务。场景图生成主要

通过目标检测模块提取出一张图像中实体和实体间关系的三元组形式,即主语、关

系和宾语,构建语义结构化表示。但由于视觉任务中训练数据集的实体间关系呈长

尾分布,头部关系类别往往是一些粗粒度的描述,相对于具有丰富信息和现实意义

的尾部关系类别则没有足够的训练样本,导致学习到的场景图不具有现实意义。同

时,由于长尾效应带来的关系语义空间不平衡的问

文档评论(0)

1亿VIP精品文档

相关文档