大规模行人检索方法研究.pdfVIP

  • 12
  • 0
  • 约18.92万字
  • 约 108页
  • 2021-02-04 发布于江西
  • 举报
摘 要 摘 要 大规模行人检索在实际场景中有广泛的应用,如监控安防、签到门禁和群体 性事件识别和预警等,其涉及的相关研究问题也是人工智能领域的重要内容,已 经在很长的时间范围内受到了学术和工程领域的广泛关注,成为了具有理论和应 用价值的前沿方向之一。行人的底层视觉特征检索和行人的高层语义属性检索是 行人检索的两类主要任务。对于行人底层特征检索,在大规模条件下,如何实现对 行人底层特征的高效编码和快速检索是我们使用行人检索技术进行大规模应用的 重点和难点问题。对于行人高层语义属性检索,由于语义属性的有限性和易于结 构化存储的特点,检索速度往往很快。但是对行人语义属性抽取的精度又成为了 限制因素。监控视频下的行人图像往往具有多视角、不清晰、有噪声、光照多变等 不利条件,这大大影响了语义属性抽取的精度。如何在受限的条件下,建立合适 的模型,充分挖掘训练数据中的信息,提高行人属性抽取的精度是需要我们研究 的关键问题。此外,为了满足实际行人检索应用的精度和性能要求,建立一个具 有通用性的查询后处理框架,对底层视觉特征和高层语义特征检索的结果进行调 优也是行人检索研究必不可少的组成部分。针对上述挑战,本文提出以下创新点: 第一,本文尝试使用哈希二值编码的方式提高行人检索的速度,并对深度有 监督哈希方法进行理论分析,探究深度有监督哈希方法具有高比特相关性问题导 致无法扩展的原因,提出了去比特相关深度有监督哈希框架。在此基础上,我们 又提出了混合显隐属性哈希特征抽取模型,在行人哈希检索任务上表现良好。 第二,本文提出了分组循环学习行人属性识别框架,以充分挖掘行人高层语 义属性的组内和组间关联关系。在这个框架下,我们首先提出了基于身体部位生 成的分组循环学习模型,然后对这个模型进行优化,提出了引入卷积长短时记忆 单元的卷积循环属性识别模型,并将注意力机制纳入该模型结构中,这种模型不 需要独立训练身体关节点检测网络就可以达到更高的属性识别精度。我们提出的 端到端的属性识别框架在精度、速度和易用性上都有较好的表现。 第三,本文提出了基于相关性判别模型的查询扩展框架,使用从数据中学习的 相关性判别模型对查询扩展的样本选择过程中的待扩展样本进行相关性判别,优 化查询扩展过程。本文提出的方法将深度学习技术引入行人检索后处理框架中。这 种方法可以用较少的时间开销,达到与先进的行人检索后处理人工算法接近的查 询结果优化效果。 关键词:行人检索;属性识别;查询扩展;哈希;深度学习 I 目 录 目 录 第 1 章 绪论 1 1.1 研究背景与意义 1 1.1.1 理论研究价值 2 1.1.2 实际应用价值 4 1.2 国内外研究现状 5 1.2.1 图像底层特征检索 5 1.2.2 图像高层语义检索 7 1.2.3 检索结果后处理 9 1.3 有待研究的科学问题 11 1.4 研究内容与主要贡献 13 1.5 实时视频流监控行人检索系统 14 1.5.1 系统架构 15 1.5.2 系统功能 17 1.6 本文的组织结构 18 第2 章 去比特相关混合语义二值特征抽取 19 2.1 本章引言 19 2.2 相关工作 23 2.2.1 图像二值特征表示 23 2.2.2 行人属性识别 24 2.3 深度有监督哈希方法比特相关性分析 25 2.4 去比特相关深度有监督哈希 27 2.5 行人混合语义二值特征抽取 29 2.5.1 模型结构 29 2.5.2 不同标注类型下的两路数据训练算法 30 2.6 实验分析 31 2.6.1 数据集和实验设定 31 2.6.2 对照组方法 32 2.6.3 实现细节和实验结果 33 2.6.4 深入分析 38 2.7 本章小结 40

文档评论(0)

1亿VIP精品文档

相关文档