- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2008年伞围高性能计算学术年会
基于反馈的链式结构数据预取
漆锋滨 王 飞 李中升
(江南计算技术研究所无锡214(}83)
coin)
(weedyblues@126
摘 要:本文在研究ORC编译器反馈式编译优化 中读出存放的内容才能得到需要访问的地址,这
技术的基础上,针对Alpha结构的特点,对针对 样对于一个由p=p一next构成的链表,要想预取
链式结构的反馈式数据预取进行了优化 p后面的第n(n1)个节点,必须访问第n一1到
SPEC2000测试表明,平均性能提高了4.1%。第一个节点间的所有节点,这就是所谓的“指钊‘
关键词:反馈式编译优化数据预取链式数据 追逐”问题。基于静态的编译分析难于处理链式
结构 结构的“指针追逐”问题。在最近的研究中,提
出了基于反馈的软件预取方法,如Chilimbi”】、
FeedbackDirectedData Wu”J,通过程序执行时的信息来获取不规则访存
Prefetching
中隐藏的规律,从而伺机捕入预取,提高应用程
Optimization
WANGFeiLI 序的性能。
Q1Feng--bin Zhong—-sheng
Institute
(JiangnanofComputingTcchnology, 开源编译器ORC2.1中实现了基于反馈的数
Wuxi,214083) 据预取,将其移植到Alpha上后,对SPEC2000
Abstract:Inthis weresearchthe 进行反馈预取的测试,发现性能反而下降。:本文
paper profile
inORC the
guidedoptimizationcompiler,improve
钊对Alpha的结构特点,对算法进行改进,使性
tofeaturesof 能得到较大的提升。1
prefetchingalgorithmaccording
architectureSPEC2000 test
Alpha performance
2基于反馈的链式结构数据预取及
shows
4.1%speedup
words:feedbackdirected 其在ORC中的实现
Key optimization,data
datastructure
prefetching,linked 预取的关键是对可能发生cache不命中的访
存地址的预测,并对预取指令进行恰当的调度以
1 引 言
求隐藏全部防存延迟。对于规则的数组访问,如
Mows7r…的预取算法,通过局部性分析,循环展开
随着技术和T艺的发展,现代高性能微处理
和软件流水可以达到很好的优化效果。
器的运算速度越来越快,而存储系统的增长速度
文档评论(0)