- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用于结构层动态热量管理的快速热仿真
用于结构层动态热量管理的快速热仿真
摘要:由于功耗密度呈指数增长,采用动态热量管理的工作温度的实时调节成为必须。本文提出了一种新颖的用于高效动态热量管理的芯片结构层热量分析方法。我们的新方法是基于以下观测资料:微处理器在标准工作负载下运行时的结构层模型的功耗呈现很强的自然周期性。可以利用这一特征用频域谱分析来计算稳态响应。采用了数字稳态瞬态匹配算法以得到由初始条件和恒定功率输入引起的瞬态温度变化。总的瞬态响应是两次仿真结果之和。采用快速热量分析算法相比传统的综合基础瞬态分析速度提高了10倍-100倍而仅仅有少量的精度损失。
1.简介
随着当今IC技术进入纳米时代,非常高的封装密度和工作频率将会导致功率密度的急剧增长。指数级的功率密度增长则相应地导致平均片上温度快速升高。此外,局部的热点处,有着比平均水平高的多的功率密度,造成了更高的局部温度。
高温对于芯片的性能和可靠性有着明显的不利影响。过高的片上温度会导致传输速度降低、漏电流功耗增大、互连电阻增大,并且可靠性降低。有理由相信如今的高性能微处理器和嵌入式系统非常需要由动态热量管理(DTM)来即时地调节片上温度,参考文献[3,12]。
DTM的基本思路是通过一系列方法,诸如活跃点转移、局部挂起、动态电压频率缩放,参考文献[3,12],来动态地降低芯片中一些过热单元的温度。热量模型和DTM仿真的一个关键问题是通过芯片结构级的DTM技术来高效地计算由于功耗不同引起的温度变化。
先前许多研究工作把注意力集中到电路级或者门级的热量模型和仿真。由于电路级或门级大量的热量器件和功耗源,提出了不同的方案来提高热量电路仿真的效率,主要可以分为两类:
第一种方法是基于离散差分算子(偏微分方法)或者the field quality(限定变量方法)。参考文献[16,15]所示,整个芯片被离散化,差分方程表示的热量传输方程用偏微分或限定变量法解出。这些方法的主要困难是由大量网络造成的数量巨大热量电流的结果。还提出了一些不同的技术来解决如此巨大数量的的热量电流,例如参考文献[16]中的ADI,和参考文献[15]中的模型规则简化。第二种方法是基于格林函数的方法,参考文献[14,17],和上面的方法相比由于简化了热量问题的双空间模型,这一方法提供了一种快速的降低精度的热量仿真。
尽管已经提出了很多电路级或门级热量分析的有效算法,但是还是很少有人关注芯片结构级的热量模型和仿真。在设计时结构级的热行为无法在电路级或门级看到,因为不同的负载会产生不同的热量效果。在结构级采用DTM的好处时由于它可以捕捉程序运行时的状态,并且快速地在程序内部或者跨程序适应不同的特征。
此外,最近的研究表明结构级的热量管理在最坏的情况下,参考文献[12,13,5],可以仅以微小的性能降低为代价而显著减少封装的代价。一种名为HotSpot的结构级热量建模和仿真工具被开发来给标准版图程序开拓和研究调节微处理器运行温度的不同的DTM技术。HotSpot提供了一种精确的结构级热量模型,它基于与微结构块和封装各个基本方面相关的热电阻和电容的等效热电流。各个部分温度由功率仿真产生的功耗得到。
然而,HotSpot评估不同DTM技术的功效依赖于整个程序运行过程中瞬态热量仿真执行的时间。HotSpot对热量行为建模所依靠的等效热量电路由热电阻和电容组成。它在每个运行时间片使用常规的积分基础瞬态仿真进行计算以获得全部的温度概况。当一个程序导入到HotSpot时,它的初始的功耗由常规间隔得出。然后,由最后时间片和前几个时间片的温度计算每个时间片的温度。为了得到任意一个确定时间下的该程序温度,都必须所有之前时间点的温度值,因为每一个时间点都依赖于它前面的时间点。由于现在的版图程序一般都有上百亿甚至上千亿的语句,这个算法需要很长的仿真时间(数周)。因此,需要一个更快并且精确的瞬态仿真技术来有效地设计和优化芯片结构级温度测量。
在本文中,我们为动态热量管理提出了一种在结构级的快速暂态热量仿真算法。我们是从近来关于程序长时间运行行为的发现得到启发。大多数程序的行为并不是随机的,实际上由于循环和块的存在而表现出很强的周期性,参考文献[9,11,10]。许多程序在不同的时间执行不同的块,这一系列块表现出特定程序特征,每一个可能与其他块完全不同,而各自又有非常相似的周期性表现。这也同样反映了各个运算单元输出功耗的周期特性。【图1】的快照是SPEC CPU 2000芯片组内部寄存器运行Lucas程序14个周期内的典型的功率曲线。每个周期包括了20万个指令周期内得到的20个功率值。这条曲线是由3GHz处理器仿真得到的,因此,每个周期等于0.26ms,整个曲线代表程序运行的3.6ms。我们可以看出,即便在这么短的时间内也有非常强的周期性。
Lucas程序中的整型寄
文档评论(0)