- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
众核发展趋势浅析众核发展趋势浅析
众核发展趋势浅析顾名思义,众核(ManyCore)处理器比多核(MultiCore)处理器中的处理内核数量还要多,计算能力更强大,这得益于1965年Gordon Moore预测的Moore定律在延续。如果从wikipedia上搜索ManyCore,你会得到这样的介绍:“当前的软件结构可以在当前的多核结构上得到较好的扩展,但如果超过八个处理器核,当前软件结构的扩展能力将会很差。超过八个处理器核的设计就被称为‘众核’处理器。”????微软公司在2007年6月25日在美国西雅图召开了第一个以ManyCore为主题的Workshop,这是一个标志性的事件,与会者都是来自世界工业界的领袖和学术界的权威,讨论众核设计应如何开展。Intel正在研发的面向媒体应用领域的Larabee、IBM正在研发的面向科学计算领域的Cyclops、面向网络安全等领域的Tile64都是对众核设计的探索。微软公司于2007年11月发表了宣言《THE MANYCORE SHIFT: Microsoft Parallel Computing Initiative Ushers Computing into the Next Era》,宣布转入对众核系统软件的研究。可以看出,众核设计已经成为技术发展的趋势和学术研究的热点。????本文将浅显地回答四个问题,这是我们开展众核设计最关心的问题,即计算所为什么要做众核设计?众核设计的技术问题是什么?适合于众核的应用是什么?计算所在众核设计上开展了哪些工作?
一、计算所为什么要做众核?????计算所的传统优势在于以高性能计算为核心的芯片和系统设计,五十多年来几代人一直围绕这个领域辛勤耕耘,从成果到文化上都有了相当的积淀,特别是2000年后,成功研发的多款龙芯芯片更为我们在高性能计算核心技术上取得了实质性突破。众核设计恰恰可以增强我们在高性能计算领域的优势地位,以众核研究为基础的大型并行系统设计可以进一步巩固计算所在战略性、基础性、前瞻性的国立研究所定位。????众核设计的核心目标就是充分开发片上高性能计算能力,这是高性能计算发展的必然趋势。以Intel公司为例,在其推出双核和四核通用处理器的同时,开发了峰值性能超过Tera Flops的Polaris和Larabee,使单芯片计算能力得到几十倍的提升。虽然众核设计上的进步将有效推动我所在高性能计算领域的发展,但在众核设计的研究过程中,需要紧密围绕龙芯和曙光在产业应用中对此类众核高性能加速芯片的实际需求。????国内系统结构研究领域的各优秀研究团队对众核设计广泛关注,2008年3月27日,复旦大学同UIUC大学的非赢利组织Gelato承办了“Shanghai Many-Core Workshop”,国内的参与者包括计算所、清华大学、国防科大、江南所、HP中国、IBM中国、Intel中国等单位的超过一百名研究人员。可以看到,很多研究机构都在开展面向众核技术的研究工作,一场面向众核设计相关技术方向的研究竞争已经展开,从自然科学基金的项目申请上就可以清楚看到这个趋势,在2006年和2007年就有二十项左右与多核和众核相关研究的申请获得批准。????由此可见,无论从计算所的传统优势和计算所的定位,还是从技术发展趋势,以及从科研资源获取角度分析,尽快将众核研究推向深入都是势在必行。
二、众核设计的技术问题是什么?????众核研究是一项复杂的系统性研究,完全不能简单地理解为处理器核的堆砌,分析众核结构应当以看处理器结构图作为终点,而不是起点,首要关注的是隐藏在结构图后面系统化的设计思想。下面我们从三个层次进行分析,说明众核设计所涉及的关键技术。????众核设计的基础是摩尔定律的延续,也就是人类掌握的最先进的硅制造工艺的进步。制造工艺的进步带来了四个主要的变化:1. 集成度提高,2. 带宽受限,3. 功耗问题突出,4. 线延迟变长。这些芯片生产工艺变化直接引出了众核设计的关键问题。????首先,芯片集成度的提高是众核设计的基本条件,这使得更多的计算资源可以集成在一块芯片上,但这种集成却也带来了硬件资源管理的困难和对资源的竞争。如何容易地将计算任务进行分割,映射到众多处理器核上?众多处理器核如何分享片上有限的存储空间?如何让众多处理器核利用有限片上传输网络传递数据,而冲突最小?如何对片上众多资源进行测试和修复?????其次,芯片的访存带宽问题在众核设计中变得更为严峻,访存带宽的限制是众核发展的最大制约。以NVIDIA G8800 GTX为例,访存带宽为86.4GB/s,计算能力为588.8GFlops,每次计算需要2个4B宽数据,计算访存比约为55Flops/B,Stanford大学设计的流处理器Merrimac的计算访存比为32 Flops/B,随着工艺的进步,这个比例
文档评论(0)