基于二进制退避算法和流量感知片上网络在线故障检测.docVIP

基于二进制退避算法和流量感知片上网络在线故障检测.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于二进制退避算法和流量感知片上网络在线故障检测

基于二进制退避算法和流量感知片上网络在线故障检测   摘 要: 针对片上网络(NoC)中互连线容易发生串扰故障问题,提出了一种基于二进制退避算法(BEBOA)结合流量感知的NoC串扰在线诊断故障方案。当NoC信道空闲时,使用信道检测器检测信道以最小化NoC入侵吞吐量;当临时故障恢复时,使用基于BEBOA的检测间隔时间参数动态设定检测时间,使网络快速恢复。此外,构建一种优先级仲裁机制,避免应用程序和检测程序发生信道访问冲突。实验结果表明,提出的方案能够准确检测和诊断故障,并能够迅速恢复吞吐量,同时具有最小的额外芯片面积开销需求。   关键词: 故障检测; 片上网络; 二进制退避算法; 互连线串扰; 监控模块; 优先级仲裁机制   中图分类号: TN711?34; TP399 文献标识码: A 文章编号: 1004?373X(2016)05?0014?05   片上网络(Networks?on?Chip,NoC)[1]是一种用于复杂片上系统(System?on?Chip,SoC)的可扩充且有效的通信架构,片上网络越来越高的复杂性导致出现多种互连问题[2]。为了保证现代NoC能适应故障且正常运行,需要开发一种能在互连结构中进行自我检测和自我维修的容错策略[3]。   由于NoC网络中存在大量互连结构,传统测试机制不能有效诊断和定位故障。因此,本文提出一种利用监控模块(Monitoring Module,MM)在线检测和诊断NoC互连线串扰故障,并以并行方法运行,最小化NoC入侵吞吐量。   1 NoC故障模型   NoC中常见的故障为逻辑层的门级故障、桥接故障和串扰故障[4],本文主要针对串扰故障进行研究。   在NoC互连中,串扰故障通常由空间相近的两条逻辑信道线路的信号相互影响而形成。本文使用最大激励串扰故障(Maximal Aggressor Fault,MAF)[5]模型描述导致串扰故障的所有原因。在MAF模型中,线路受相邻线路传输数据信号的干扰而形成串扰故障,如图1所示MAF模型形成的6种串扰方式,分别为正/负脉冲、上升/下降延迟、上升/下降加速。   图1表明检测器需给每条线路发送2个测试向量来形成各种可能干扰,因此需要12种测试向量来检测6种可能干扰。MAF模型对于一种[N]位信道,设定第4 b作为受干扰线路,测试向量[(v1,v2,…,v8)]依次发送特定测试向量,用于检测6种可能串扰故障,如图2所示。   2 提出的串扰故障检测方案   本文利用CCD组件[6]的监控模块来增强路由器检测故障的能力,监控模块通过隔离测试过程的流量和执行常规应用程序流量来管理NoC测试过程的入侵流量,使用基于二进制退避算法(Binary Exponential Back?off Algorithm,BEBOA)[7]的检测间隔时间参数动态设定检测时间,使网络快速恢复。   图3所示为监控模块与路由器中其他组件的连接结构。对一种n b数据包,最重要的4 b定义为头,目标地址占16 b,其余bit为有效负荷。以“(002025A5A)16”为例,则头字段为(0)16,目标地址为(0202)16,有效负荷为(5A5A)16。仅使用1 b的MSB表示数据包类型,若头字段的MSB为1,则该数据包为测试数据包,否则为常规应用程序数据包。   图4为两个路由器通过East端口和West端口相互连接的例子。监控模块(MM)有4个子组件,信道拥堵检测器(CDD)、信道检测器(CT)、流量传感器模块(TSM)和测试间隔时间决策模块(TID),下面详细介绍这些模块。   2.1 信道拥堵检测器   本文使用信道拥堵检测器(Channel Congestion Detector,CCD)[8]检测信道的当前流量状态,为流量传感器模块提供信道拥堵信息。流量状态分类为:信道不拥堵、信道繁忙和信道拥堵。该方法能有效地做出路由决策,选择轻拥堵路由,提高信道吞吐量。   2.2 流量传感器模块   由于故障检测应用程序和常规应用程序共享使用信道,所以流量传感器模块(TSM)定义了一种优先级仲裁方案,以避免冲突。TSM通过每个信道局部CCD提供的繁忙/拥堵/故障信号来获得端口状态,以此做出仲裁。共享信道的优先级定义如图5所示。   当信道处于无故障状态时,常规应用程序能随时通过无故障信道传输数据,因此常规应用程序([pregular])的优先级高于故障检测应用程序([ptest])优先级,即[pregularptest。]常规应用程序完成数据传输后,信道变为空闲状态时,则[pregularptest,]故障检测应用程序可以访问和检测信道。   如果信道发生故障,故障检测应用程序将重复检测信道且限制常规应用程序传输数据,即[preg

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档