逻辑核动态可重构的众核处理器体系结构-计算机系统结构专业论文.docxVIP

逻辑核动态可重构的众核处理器体系结构-计算机系统结构专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要摘 摘要 摘 要 随着半导体技术的发展,摩尔定律继续有效,单块芯片上集成的处理器核数 将不断增加;同时为追求更高的性能功耗比和性能面积比,众核结构成为芯片设 计的必然选择。众核处理器中丰富的计算资源和高效的片上通信使得面向吞吐率 的应用具有天然的性能优势,但是由于处理器核粒度变小,在单核上执行串行应 用的性能无法保证。为解决这一问题,近年来具有逻辑核构造能力的众核处理器 体系结构研究备受关注,其基本思想是基于多个细粒度处理器核(称为物理核) 构建粗粒度逻辑核,期望利用众核结构丰富的计算资源,将不断增加的处理器核 转化为单线程串行应用的性能提升。目前已有的工作对这种众核结构的通信开销 处理、逻辑核粒度配置灵活性和应用映射方式等方面尚缺乏深入的研究。 本文针对细粒度众核结构上串行程序的有效执行问题,从执行模型、微结构 设计和动态资源控制等几方面展开深入探讨,对于探索逻辑核动态可重构的众核 处理器体系结构具有重要的学术意义和应用价值。本文主要研究内容和成果包括 以下几个方面。 (1)研究了具有逻辑核构造能力的众核处理器重构开销问题,提出逻辑核 动态可重构的众核结构FTPA(Flexible Tiled ProcessorArchitecture)。FTPA采用 类数据流驱动执行的指令集体系结构,在不改变串行编程模型前提下,利用数据 流驱动和线程级推测相结合的执行模型,同时开发单线程程序中的指令级并行和 线程级并行。为解决众核处理器逻辑核重构开销过大问题,FTPA将物理核内资 源通过片上路由网络划分为易重构的计算资源和不易重构的共享资源,从而使得 逻辑核粒度能够在两个层面以两种频度进行异步调整,具有高度灵活性。 (2)研究了串行程序采用细粒度线程级推测执行模型时,应用推测执行能 力的实时评估机制。针对串行应用不同执行阶段并行性特征存在的显著差异,利 用时间局部性,为众核结构逻辑核粒度动态重构进行有效指导,本文提出基于“推 测执行阶段”和“推测深度”概念的线程级推测执行能力量化评估方法,并以此 为基础提出利用推测深度的局部历史、全局历史和锦标赛三种推测执行能力评估 器设计,只需要数十位存储资源,就可以有效预测串行程序并行性变化趋势,对 推测深度作出有效估计。 (3)研究了将推测执行能力评估器用于指导FTPA众核结构逻辑核动态重 构的有效性。为有效处理众核结构分布式执行导致的通信开销,以指令窗口和功 能部件为核心的计算资源可以按照平铺式和深度式两种映射方式构建逻辑核,从 而适应具有不同并行性特征的应用。本文将线程级推测执行能力评估器用于指导 FTPA逻辑核动态重构,分别从平铺式映射和深度式映射两方面对性能和资源利 摘要用进行了详细实验评估。结果表明,相对于采用固定粒度逻辑核的FTPA配置, 摘要 用进行了详细实验评估。结果表明,相对于采用固定粒度逻辑核的FTPA配置, 动态逻辑核重构方式只需一半物理核计算资源就可以有效支持细粒度线程级推 测执行,性能降低不到13%,资源利用率显著提高。 本文的研究工作可以得出如下认识: (1)逻辑核是众核处理器上加速串行应用的有效手段,但是将细粒度物理 核资源耦合在一起需要高效的结构支持,如本文提出的计算资源和共享资源的分 离设计,平铺式和深度式映射方式等。 (2)在众核处理器上采用细粒度线程级推测执行模型加速串行程序需要在 性能和资源利用率之间进行权衡,合理的逻辑核重构必须建立在对应用执行特征 精确认识的基础上,线程级推测执行能力评估器是一种有效尝试。 本文提出的FTPA众核处理器所采用的计算资源和共享资源分离方法、平铺 式和深度式逻辑核重构以及线程级推测执行能力评估器设计等都可以作为一般 方法论进行推广,应用于其他众核结构中。 关键词:众核处理器物理核逻辑核推测执行能力评估器 II ABSTRACTWith ABSTRACT With the evolving ofsemiconductor technology,the Moore’S Law is continuing, and the number of processor cores integrated on single chip goes on increasing·For power and area efficiency,manycore processor architecture is all unescapable choice· With abundant of computing resource and highly efficient on。chip-network,manycore is suitable for applications with throughput requierments.As the pr

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档