CN113591527B 一种对象轨迹识别方法、装置、电子设备和存储介质 (腾讯科技(深圳)有限公司).docxVIP

CN113591527B 一种对象轨迹识别方法、装置、电子设备和存储介质 (腾讯科技(深圳)有限公司).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN113591527B(45)授权公告日2025.07.08

(21)申请号202110049271.6

(22)申请日2021.01.14

(65)同一申请的已公布的文献号申请公布号CN113591527A

(43)申请公布日2021.11.02

(73)专利权人腾讯科技(深圳)有限公司

地址518044广东省深圳市南山区高新区

科技中一路腾讯大厦35层专利权人复旦大学

(72)发明人邱泰儒陈冠先祁仲昂单瀛李斌薛向阳

(74)专利代理机构北京同达信恒知识产权代理有限公司11291

专利代理师朱佳

(51)Int.CI.

GO6V20/40(2022.01)

GO6V40/16(2022.01)

GO6V10/774(2022.01)

GO6V10/80(2022.01)

GO6N20/00(2019.01)

(56)对比文件

CN106022220A,2016.10.12

CN112070807A,2020.12.11

CN108875588A,2018.11.23

YihongChen等.MemoryEnhancedGlobal-LocalAggregationforVideoObject

Detection.2020IEEE/CVFConferenceon

ComputerVisionandPatternRecognition(CVPR).2020,10335-10338.

审查员祝梦花

权利要求书4页说明书27页附图8页

(54)发明名称

一种对象轨迹识别方法、装置、电子设备和存储介质

(57)摘要

CN113591527B本申请涉及计算机技术领域,尤其涉及人工智能技术领域,提供一种对象轨迹识别方法、装置、电子设备和存储介质,用以提高视频中对象重识别的准确率。其中,方法包括:对待识别视频进行镜头分割,获得多个视频片段,每个视频片段对应一个镜头;对获得的各视频片段进行对象检测,分别确定在各视频片段中检测到的各对象的检测框;将同一对象在同一视频片段不同视频帧中的各检测框连接,分别获得各视频片段中,各对象各自的追踪轨迹;针对各对象,将同一对象在不同视频片段内的追踪轨迹进行连接,获得待识别视频中各对象的运动轨迹。本申请结合视频的特性,将对象轨迹识别过程划分为对象检测,轨迹追踪和重识别这三个部分,提高了对象重识别

CN113591527B

对待识别视频进行镜头分割,获得多个视频片段

对获得的各个视频片段进行对象检测,分别确定在各个视频片段中检测到的各个对象的检测框

分别针对各个视频片段,将同一对象在同一视频片段内

不同视频帧中的各个检测框进行连接,分别获得各个视

频片段中,各个对象各自的追踪轨迹

针对各个对象,将同一对象在不同视频片段内的追踪轨

迹进行连接,获得待识别视频中的各个对象各自的运动

轨迹

S22

S23

CN113591527B权利要求书1/4页

2

1.一种对象轨迹识别方法,其特征在于,该方法包括:

对待识别视频进行镜头分割,获得多个视频片段,其中,每个视频片段对应一个镜头,且每个视频片段包含至少一个视频帧;

针对获得的各个视频片段中的各个视频帧,分别执行如下操作:在一个视频帧归属的视频片段中,获取所述一个视频帧之前的视频帧中包含目标对象的区域的特征图,与所述一个视频帧对应的特征图之间的第一互相关度,并获取所述一个视频帧之前的视频帧中的检测框的位置信息;基于所述第一互相关度确定所述一个视频帧中与所述目标对象相应的对象所在的第一区域,并通过增强所述第一区域的特征,获得相应的局部语义融合特征;基于所述位置信息确定所述一个视频帧对应的特征图中相应的第二区域后,通过增强所述第二区域的特征,获得相应的局部位置融合特征;以及,将所述一个视频帧以及所述一个视频帧之前的视频帧各自对应的全局语义信息进行融合,获得相应的全局语义融合特征;基于所述局部语义融合特征、所述局部位置融合特征和所述全局语义融合特征,对所述一个视频帧进行对象检测,确定在所述一个视频帧中检测

您可能关注的文档

文档评论(0)

aabbcc + 关注
实名认证
文档贡献者

若下载文档格式有问题,请咨询qq1643702686索取原版

1亿VIP精品文档

相关文档