- 0
- 0
- 约1.25万字
- 约 13页
- 2023-06-16 发布于四川
- 举报
本发明涉及跨模态检索领域,公开了一种基于关系推理网络的视频和文本的跨模态检索方法,包括:提取视频数据特征和文本数据特征;运用循环神经网络获取视频全局特征和文本全局特征;运用多尺度关系推理网络构建视频局部关系特征和文本局部关系特征;分别融合单模态数据的全局特征和局部关系特征获得视频融合特征和文本融合特征;映射视频融合特征和文本融合特征到公共空间,并对齐公共空间中的视频融合特征分布和文本融合特征分布;对整体网络进行训练。本发明同时关注全局特征和局部关系特征,能更有效的聚焦到单模态数据中的重点信息,进
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113239159 A
(43)申请公布日 2021.08.10
(21)申请号 202110451431.X G06F 16/532 (2019.01)
原创力文档

文档评论(0)