基于反馈的链式结构数据预取研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2008年伞围高性能计算学术年会 基于反馈的链式结构数据预取 漆锋滨 王 飞 李中升 (江南计算技术研究所无锡214(}83) coin) (weedyblues@126 摘 要:本文在研究ORC编译器反馈式编译优化 中读出存放的内容才能得到需要访问的地址,这 技术的基础上,针对Alpha结构的特点,对针对 样对于一个由p=p一next构成的链表,要想预取 链式结构的反馈式数据预取进行了优化 p后面的第n(n1)个节点,必须访问第n一1到 SPEC2000测试表明,平均性能提高了4.1%。第一个节点间的所有节点,这就是所谓的“指钊‘ 关键词:反馈式编译优化数据预取链式数据 追逐”问题。基于静态的编译分析难于处理链式 结构 结构的“指针追逐”问题。在最近的研究中,提 出了基于反馈的软件预取方法,如Chilimbi”】、 FeedbackDirectedData Wu”J,通过程序执行时的信息来获取不规则访存 Prefetching 中隐藏的规律,从而伺机捕入预取,提高应用程 Optimization WANGFeiLI 序的性能。 Q1Feng--bin Zhong—-sheng Institute (JiangnanofComputingTcchnology, 开源编译器ORC2.1中实现了基于反馈的数 Wuxi,214083) 据预取,将其移植到Alpha上后,对SPEC2000 Abstract:Inthis weresearchthe 进行反馈预取的测试,发现性能反而下降。:本文 paper profile inORC the guidedoptimizationcompiler,improve 钊对Alpha的结构特点,对算法进行改进,使性 tofeaturesof 能得到较大的提升。1 prefetchingalgorithmaccording architectureSPEC2000 test Alpha performance 2基于反馈的链式结构数据预取及 shows 4.1%speedup words:feedbackdirected 其在ORC中的实现 Key optimization,data datastructure prefetching,linked 预取的关键是对可能发生cache不命中的访 存地址的预测,并对预取指令进行恰当的调度以 1 引 言 求隐藏全部防存延迟。对于规则的数组访问,如 Mows7r…的预取算法,通过局部性分析,循环展开 随着技术和T艺的发展,现代高性能微处理 和软件流水可以达到很好的优化效果。 器的运算速度越来越快,而存储系统的增长速度

文档评论(0)

精品课件 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档