减少推测多线程回退的片上网络优化设计与分析-计算机系统结构专业论文.docxVIP

减少推测多线程回退的片上网络优化设计与分析-计算机系统结构专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
减少推测多线程回退的片上网络优化设计与分析-计算机系统结构专业论文

摘 摘 要 摘 要 推测多线程是一项旨在简化并行编程的技术。它创建多个未静态确定线程 间依赖关系的线程,然后推测地并行执行它们,并动态检测线程间数据依赖冲 突。一旦发生冲突,违反依赖的线程被回退并重启,以保证推测执行的正确性。 但是,回退会带来具有较大的性能开销,频繁的回退会严重影响线程执行的性 能。 为了减少线程回退,改进推测多线程的性能,本文提出了一种基于优先级 的片上网络,部署在使用推测多线程技术的片上多核处理器中,通过优先传送 前驱线程的消息,使推测线程的访存操作符合串行语义,从而减少依赖冲突和 回退的发生。 本文的主要研究工作和成果包括:(1)分析了推测多线程的线程回退行为, 指出前驱线程处于整个模型的关键执行路径上,其访存延迟显著影响推测多线 程的性能,因此应该在网络中为其赋予更高的优先级。(2)提出了基于优先级 的片上网络的设计,并讨论其硬件复杂度。基于优先级的片上网络的设计对系 统软件层是透明的,同时带来的硬件开销也是可以接受的。(3)选取了合适的 测试程序,对基于优先级的片上网络的性能进行量化评估和分析。在分析中我 们验证了其有效性和可扩展性,同时也得到了对推测多线程技术和基于优先级 的片上网络的进一步认识。 本文所提出的片上网络与上层应用协同设计的方案,具有硬件开销小、简 单有效和扩放性好等特点,从片上网络这个角度改进了推测多线程的性能,拓 展了其设计空间,同时对加快推测多线程的推广具有积极意义。 关键词: 片上多核处理器 片上网络 并行编程 推测多线程 回退 优先级 I ABSTRACT ABSTRACT ABSTRACT Thread Level Speculation (TLS) is a technique aims at simplifying parallel pro- gramming. It creates multiple threads without knowing they are independent, and then speculatively executes them in parallel, hoping not to violate the inter-thread data depen- dency. In case of violation happens, the offending thread will be squashed and restarted to guarantee the correctness of execution. However, squashing incurs considerable per- formance overhead, and frequent squashing significantly cripples TLS performance. To reduce the occurrence of squashing and improve TLS performance, we propose a priority-based Network-on-Chip (NoC), which is deployed in the Chip Multiproces- sor (CMP) supporting TLS. By preferentially transferring messages from predecessor threads, the priority-based NoC guides TLS threads to perform data accessing conform- ing with the sequential semantic, and therefore brings down the count of dependency violation and squashing. The focus and main contributions of this paper are as follows. First, by analyzing the TLS squashing behavior, we draw the conclusion that predecessor threads are on the critical executing path of the TLS model, and their memory access latency impose sig- nificant impact on the TLS performance. Therefore, they should be given higher priority in the NoC. Secon

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档