粗粒度可重构阵列中的蚁群优化映射.docVIP

粗粒度可重构阵列中的蚁群优化映射.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
 粗粒度可重构阵列中的蚁群优化映射# 周理,刘冬培,刘衡竹,陈书明** (国防科学技术大学计算机学院) 5 10 15 20 摘要:粗粒度可重构阵列(CGRA)结构兼具高性能和灵活性的特点,近年来应用广泛。CGRA 的性能发挥依赖于有效的映射算法开发程序的并行性。本文提出了一种 CGRA 上的应用程 序映射方法,它采用最大-最小蚁群系统(MMAS)方法将有向无环数据流图(DAG)映射 到 CGRA 上。本文进一步研究了映射算法的优化,在减少映射时间的同时保证解的质量。 与其他启发式方法相比,本文提出的算法能够在更少的映射时间内得到更好的结果。 关键词:粗粒度可重构;应用映射;蚁群优化 中图分类号:TP332.1 Ant Colony Optimization for Application Mapping in Coarse-grained Reconfigurable Array Zhou Li, Liu Dongpei, Liu Hengzhu, Chen Shuming (Computer School, National University of Defense Technology) Abstract: Coarse-grained reconfigurable array (CGRA) architecture has become popular because of its performance and flexibility. The efficiencyof CGRA relies on an efficient application mapping algorithm to exploit parallelisms. In this paper, we proposed the min-max ant colony system (MMAS) algorithm to map data acyclic graph (DAG) onto CGRA. Optimization of MMAS is studied to reduce mapping time while maintaining the quality of solutions. Comparisons with other heuristic algorithms show that our approach obtains better results in less mapping time. Key words: application mapping; ant colony optimization; CGRA 25 0 引言 粗粒度可重构阵列(Coarse-grained Reconfigurable Array, CGRA)是一种高效灵活的硬 件体系结构,适合于计算密集型的应用。在软件无线电、多媒体处理等数字信号处理领域, CGRA 获得了大量应用[1]。这些领域的应用包含大量重复的计算,因此 CGRA 可以通过大 30 35 40 量的处理单元(Processing Element, PE)实现程序的加速。另外,CGRA 的处理单元都是可 重构的。 PE 和及其 PE 互连网络都可以通过加载上下文缓存来完成不同的功能。与现场可 编程门阵列(Field Programmable Gate Array, FPGA)不同,CGRA 中的重构是字级的 (word-level)而不是比特级的(bit-level)。CGRA 中的功能单元因此能够针对特定领域的 应用程序进行优化,以 CGRA 构建的系统不但可以获得硬件般的性能,同时还具备软件般 的灵活特性。 如何将应用程序映射到 CGRA 上影响到系统诸多性能,例如程序执行延时、功耗等等。 通常,应用程序是以有向无环数据流图形式(Directed Acyclic Graph, DAG)表示的,图中 的节点代表了操作,节点之间的边代表了数据的依赖关系。映射就是在资源约束条件下确定 每一个节点将在哪个 PE、什么时候开始执行。这个问题已经证明是 NP 问题。目前有两种 程序映射方式:时域映射和空域映射[2]。在空域映射中,PE 的配置字是保持不变的,这样 就要求应用程序足够简单,在硬件资源的限制之内。应用程序通常需要划分得足够小。而在 基金项目:高等学校博士学科点专项科研基金(No.20094307110009) 作者简介:周理(1986),男,博士生,主要研究方向:微处理器设计,数字信号处理 通信联系人:陈书明(1961-),男,教授,主要研究方向:微处理器设计. E-mail: smchen@nudt.edu.cn -1-  时域映射中,PE 每个周期都不断

文档评论(0)

文档分享 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档