- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Yao J, Miwa S, Shimada H et al. A fine-grained runtime power/performance
optimization method for processors with adaptive pipeline depth. JOURNAL OF
COMPUTER SCIENCE AND TECHNOLOGY 26(2): 292-301 Mar. 2011. DOI
10.1007/s11390-011-1132-9
基于可调整段数流水线处理器的一种细粒度动态功耗性能比优化方案
动态调整输入电压 (Dynamic Voltage Scaling, DVS )方法通过降低处理器
在低工作负荷状态下的电压来减少耗电量,并在负载上升时恢复电压。这种调整
引入数十到数百微秒的处理停顿,不利于超细粒度(微妙级别)的节能控制。基
于段数可调整流水线(Adaptive Depth Pipeline, ADP)的处理器节能方法通过设
置专用的逻辑信号来停止部分处理器流水线的段间寄存器的使用来达到节能目
的。这种方法与流水线的单次清空延迟相当,只有数十纳秒,能用来进行超细粒
度的节能控制。
基于段数可调整方案,本论文主要提出了一种超细粒度的功耗性能比优化方
案。论文建立处理器的动态功耗比模型,构筑了一个从处理器当前的性能参数(单
位时间执行的指令数)到功耗性能比最优的流水线段数的映射。通过超细粒度的
动态观测方法预测处理中的程序未来可能的工作负荷。而后,微处理器根据负载
来调整自身的流水线到最优段数,优化功耗性能比。由于综合了多个性能参数,
避免了非常短促的剧烈变化引起的过度频繁的再配置。该方法能够检测到程序执
行过程中的微小变化,将处理器调整到满足负荷的最低处理能力,从而提高性能
功耗比。
本文采用模拟工具 SimpleScalar 和 Wattch 功耗工具包,主要参数如下:
处 理 8 路流水线,乱序执行;
器 RUU 单元:128,LSQ 单元:64;
整数 ALU 单元:8,乘除单元:4;
浮点数 ALU 单元:8,乘除单元:4;
存储模块端口:8。
本文评价使用 SPEC CPU2000 的整数、浮点数共 17 个评价程序。整数应用
采用优化方法后,功耗性能比降低为原来的 86.5%。浮点数应用能降低 5.1%的处
理器的功耗性能比。这两个数据都非常接近于基于先验知识的理想化控制所能获
Yao J, Miwa S, Shimada H et al. A fine-grained runtime power/performance
optimization method for processors with adaptive pipeline depth. JOURNAL OF
COMPUTER SCIENCE AND TECHNOLOGY 26(2): 292-301 Mar. 2011. DOI
10.1007/s11390-011-1132-9
得的最大功耗性能比的降低。
本文也进行了硬件实现,与相关论文所提出的基于程序执行中的指令空间局
部性标识来优化处理器功耗性能比的方法(Signature History Table, SHT 方法)
相比,能有效的降低额外硬件的需求。在相同的功耗性能比的提高的前提下,本
文所提出方法使用的额外硬件资源为 SHT 方法的 14.1%,并将控制算法的计算时
间由 50 时钟周期(Clock Cycle)减小到 1 时钟周期。
本论文主要有以下贡献:
1. 建立了处理器的功耗性能比的模型,考察了能较精确反映处理器功耗性能
比的工作采样参数。
2. 提出了一种超细粒度的执行程序的特性分析方法,并对需要的额外硬件进
行了合理的优化。能够利用较小的硬件资源来较精确的预测执行程序在下一个工
作时间段的特性,即最大负载要求。
3. 基于 1 和 2,实现了细粒度的处理器功耗优化,从而能够最大限度的利用
可调整流水线的快速再配置的特性。
文档评论(0)