基于自适应帧选择高效识别方法研究.pdfVIP

基于自适应帧选择高效识别方法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

AdaFrame:用于快速视频识别的自适应帧选择

1∗2†32112

吴祖轩,熊才明,马志尧,理查德·索彻,拉里·S·戴维斯马里兰大学,

3

Salesforce研究院,佐治亚理工学院

摘要



我们提出了AdaFrame,这是一种在每个输入基

础上自适应选择相关帧的框架,用于快速视频识别。



AdaFrame包含一个带有全局记忆的长短期记忆网络,

该全局记忆提供上下文信息,以搜索随时间推移应使



用的帧。通过策略梯度方法进行训练,AdaFrame生成

预测,确定下一步应观察的帧,并计算看到更多帧的效

用,即每个时间步的期望未来回报。在测试时,图1:我们方法的概念概述。AdaFrame旨在根据不同

AdaFrame利用预测的效用实现自适应前瞻推理,从而输入视频自适应地选择少量帧,以在保证正确预测的

在不降低准确率的情况下减少整体计算成本。我们在两前提下降低整体计算成本。

个大规模视频基准(FCVID和ActivityNet)上进行了

的帧1,如果不是每个单帧的话[16],进行推理。虽然

广泛的实验。AdaFrame在仅使用8.21帧和8.65帧的情

均匀采样已被证明是有效的[19,28,29],,但即使分析

况下分别达到了使用全部帧的性能。我们还定性地展示

单个帧在计算上仍然很昂贵,这是由于使用了如

了学习到的帧使用情况可以表明分类决策的难易程度;

ResNet[7],ResNext[34],InceptionNet[22],等高

较容易的样本需要较少的帧,而较难的样本则需要更多

容量骨干网络。另一方面,均匀采样假设信息在时间

帧,这既体现在同一类别内的实例级别上,也体现在不

上是均匀分布的,因此可能包含与目标类别无关的嘈

同类别之间的类别级别上。

杂背景帧。

值得注意的是,做出识别决策的难度与待分类的

类别相关——一个帧可能足以识别大多数静态物体(例

1.引言如,“狗”和“猫”)或场景(例如,“森林”或

“海洋”),而要区分细微动作如

文档评论(0)

honglajiao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档