拥有生物激励神经感知引擎的实时多目标识别处理器..docxVIP

拥有生物激励神经感知引擎的实时多目标识别处理器..docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
拥有生物激励神经感知引擎的实时多目标识别处理器.

拥有生物激励神经感知引擎的实时多目标识别处理器本论文所完成的工作这篇论文提出了一种拥有生物激励神经感知引擎的实时多目标识别处理器,其运算速度为201.4GOPS,采用三级流水线架构。它采用了基于视觉感知的多目标识别算法,以对输入图像中的多个目标给予多重的关注点(attentions)。对于类人多目标感知,提出了一种拥有生物激励和模糊逻辑电路的神经感知引擎。在提出的硬件架构中,三种识别工作(视觉识别,描述符生成,及目标确定)分别被直接映射至神经感知引擎,包含128个处理元件的16个SIMD处理器及决策处理器上,并在流水线中得以执行以最大化目标识别的吞吐量。对于高效的任务流水,该文提出的任务/功耗管理器通过智能的工作量估计平衡了3级的执行次数。此外,对于包含21个IP模块的通信架构,本文提出了一种118.4GB/s的多址联播片上网络。对于低功耗的目标识别,工作量感知动态功耗管理在片级执行。1.第二部分详细地描述了一种基于多目标识别算法的视觉感知。2.第三部分解释了提出的处理器的系统架构。3.第四部分解释了各个构件块的详细设计。4.第五部分描述了提出的NoC通信的体系结构。5.芯片的实现和评估结果在第六部分给出。基于视觉感知的多目标识别A.图1. 基于视觉感知的多目标识别模型图1示出了该文提出的基于视觉感知的多目标识别模型的概念图。视觉感知是一种对先前的多目标情形下视觉关注点的扩展的机制。以视觉关注点为基础,它额外选择了目标的种子点并施行种子区域增长以对多目标探测相关(感兴趣)的区域(ROIs)。相比先前的关注点(attention),视觉感知通过突出各个目标的ROI对输入图像中的多目标给予多重关注点(attention)。在视觉感知之后,下一个目标识别任务,比如关键点提取和数据库匹配,在仅将焦点放在选定的ROIs上施行。通过只处理整个图像的关键区域,目标识别的计算代价也得以与选定ROIs的面积成比例的减少了。B.图2. 三级多目标识别算法图2示出了该文提出的多目标识别处理器的总体算法。它被分成了三级,各级扮演的角色为:视觉感知、描述符生成和目标确定。这一算法可实时地识别大约50个办公室物品,适用于自主式机器人的视觉系统。系统架构图3. 该问题出的处理器的总体模块示意图图3示出了该文提出的处理器的总体的模块架构。它包含21个IP块:一个神经感知引擎(NPE),一个任务/功耗管理器SPU(从属处理器), 16SIMD处理器单元(SPUs), 一个确定(目标)处理器(DP), 以及2个外部存储器接口。其中该NPE负责第一个视觉感知级。它提取出各个目标的ROI网格片并将它们发送至16个SPUs以进行细节的图像处理。这16个SPU的功耗区间被分为4个,它们负责第二个描述符生成级。它们从选定的ROI中提取出目标的特征并将其转换为描述符向量。16个SPU的这些描述符向量在DP汇集。对于第三个目标确定级,DP加速了描述符向量的向量匹配处理。STM专为描述从NPE到16个SPU的ROI网格片并管理它们的任务而设计。它也控制整个处理器的流水级并管理16个SPU的四个功耗区间。总的21个IP块通过文中提出的多址联播NoC相互连接。为提高文中提出的处理器的并行性和硬件利用率,该文提出的三级流水在如图4所示的框架级上执行。流水的数据分别为第一级和第二级之间的ROI网格片和描述符向量。由于其固定的计算量,第一个视觉感知阶段的执行时间为恒定的。不同于此,第二阶段—描述符生成和第三个阶段—目标确定的执行时间随着ROI网格片和描述符向量的数量而变化。为了平衡三个阶段的执行时间,STM根据提取到的ROI网格片和描述符向量的数量分别估计随后的描述符向量和目标确定的工作量,并采用两个流水线时间平衡方案控制他们的执行次数。图4. 三级流水线架构构件块的设计A.神经感知引擎图5.神经感知引擎和SPU任务/功耗管理器的模块示意图图5示出了NPE的模块简图。对于高效的ROI检测,NPE采用一个32位的RISC控制器和3个硬件引擎;运动测估器(ME),视觉关注引擎(VAE),和目标检测引擎(ODE)。该ME被用于在两个相继的回合中提取动态运动向量,并由PE数列用完全搜索快匹配的方法实现。VAE用于提取静态特征(比如强度,颜色和方向)。ODE用于执行最后的对各个目标的ROI分类。RISC控制器在控制三个专用引擎和执行软件导向的操作上发挥一定的作用。有一个24KB的存储器用于存储原始的图像和三个引擎间的通信数据。B.SIMD处理单元图6.SIMD处理器单元及其dual-issued VLIW (超长指令字)PE(感知引擎)各个dual-issued VLIW PE详细的模块示意图在图6给出。它包括两个独立的数据通路用于诸如ALU、移位、乘法等的数据处理操作,以及诸如加载和存储等数据转

文档评论(0)

dbtx + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档