网站大量收购独家精品文档,联系QQ:2885784924

多核与众核处理芯片技术发展.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高性能多核和众核处理机 芯片技术发展 李三立教授 清华大学 引言 处理机永远是计算机技术和产业的重要驱动力。 要进一步发展千亿次(Petaflops)高性能计算机,是离不开多核与众核芯片的发展的;计算机体系结构的新技术大多体现在高性能多核与众核芯片上。希望我们关注高性能计算技术的发展; 现在计算机体系结构是“系统”都做到“芯片上”去了(SOC)。希望我们计算机学院的“计算机组织”和“计算机体系结构”课程的老师和学生能够在教学与学习中增加这方面内容,老师在申请自然科学基金和其它科研经费方面也注意加重这方面的研究方向; 希望我们年轻教师和学生把兴趣放在这一领域,把我国的处理机芯片技术搞上去。 我国万万亿次超级计算机CPU有望全部国产化 我国天河一号千万亿次超级计算机 世界500强第一名,奥巴马专门提到它 世界500强第一名天河1号插件版 提纲 1。多核与众核处理机结构芯片技术的需要 2。多核和众核体系结构处理机芯片的发展 3。异构多核众核结构芯片 4。片上系统SOC互联网络的发展 5。微电子工艺的进一步发展 6。未来exaFlops高性能计算机芯片预测 7。结论 (一)。 多核与众核处理机结构芯片技术的需要 晶体管数目增长--Intel 芯片上频率不能持续增长—功耗问题 功耗引起发热—直观图片 CPU的水冷和风冷 解决功耗增长和晶体管增长的矛盾 解决方案: 新制造材料; 新制冷技术; 多核和众核体系结构 多核和众核的发展对于性能的影响 体系结构进展: 单核?多核?众核-片上互联 AMD通用单核的内部结构 AMD 双核芯片的布局 双核AMD Opteron? 处理机 199mm2 90nm 工艺 单核 AMD Opteron 处理机 193mm2 130nm 工艺 AMD Opteron 的多核架构 Intel多核与众核解决路线 Intel Nehalem多核处理机层次式存储结构 (二)。多核和众核体系结构 处理机芯片的发展 为何要多核? 进一步多核异构芯片--SOC 多核技术将要多样化! Multiple parallel general-purpose processors (GPPs) Multiple application-specific processors (ASPs) 众核处理机结构 多核芯片的片上、片外访存速度设计考虑 (数据访问速度—Memory Wall) (三)。异构多核结构芯片 为什么要发展异构众核芯片 1。要研制千万亿次(PetaFlops)高性能计算机,单靠Intel 或AMD通用同构型众核芯片是不行的,必须要有加速器; 2。同构众核芯片又会遇到功耗问题,每个核都要有它Cache等配合硬件;因此,加速器要用较大量的“小核”; 3。如果CPU和GPU芯片合用,因为GPU要求大量数据,所以在芯片之间传送大量数据,是瓶颈,很难达到峰值; 4。因此,CPU和GPU应该做在一个芯片上,芯片上的数据传输频带要宽很多;更进一步,GPU仍然有编程困难的问题,如有针对专门用途的、算法和编程都比较能简化的小核,更为合适。另一个办法是在众核中扩充指令、实现加速。 5。高性能计算机有分向的趋势,一般通用HPC用现有的刀片式服务器、再加上Infiniband就可以很快造成,价廉、研制速度快;而自己专门设计板级产品的、几个PetaFlops的 HPC一般都只能针对一、二种应用,有专用化的趋势。 GPU对于超级计算机并非理想 GPU对于高性能计算的编程不适当,解决办法是把CPU和GPU结合。 Jack Dongarra说:“The obvious upside of GPUs is that they provide compelling performance for modest prices. The downside is that they are more difficult to program, since at the very least you will need to write one program for the CPUs and another program for the GPUs. Another problem that GPUs present pertains to the movement of data. Any machine that requires a lot of data movement will never come close to achieving its peak performance. The CPU-GPU link is a thin pipe, and that becomes the strangle-point for th

文档评论(0)

l215322 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档