网站大量收购独家精品文档,联系QQ:2885784924

多核程序的设计课件1概述.ppt

多核程序的设计课件1概述.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多核程序的设计课件1概述

多核程序设计 2008年8月18日 教材 主教材:《多核程序设计》,ISBN 9-787302-158356, 清华大学出版社, 2007年8月 参考书:《多核程序设计技术-通过软件多线程提升性能》, 电子工业出版社,ISBN 9787121038716, 2007年3月 实验环境 硬件: 英特尔多核计算机:双核酷睿2 软件: Visual studio 2003/2005 Intel C++ compiler 10.0 for linux for windows Intel MKL 9.1 for Linux Windows Intel ThreadChecker 3.1 for Linux Windows Thread Profiler 3.1 for Windows Vtune 9.0 for Windows Linux 课件、工具、录像、代码 第一章 并行与多核体系结构概论 微处理器 1971年,第一款微处理器4004 1978年,英特尔公司8086 1979年,英特尔公司又开发出了8088 1981年,美国IBM公司将8088芯片用于其研制的PC机 1982年,英特尔公司研制出了80286微处理器 1985年10月17日,英特尔80386 DX正式发布 1989年,英特尔推出80486芯片 1993年,新一代586 CPU问世 1996年底,多能奔腾Pentium MMX 1998年,奔腾二代Pentium II 、至强微处理器Xeon、赛扬Celeron 1999年春,英特尔公司Pentium III奔三 2000年,英特尔公司Pentium 4,奔四 2002年,英特尔超线程技术(HT,Hyper-Threading) 2005年4月18日,英特尔全球同步首发奔腾D处理器 指令集变化 提高电脑在多媒体、3D图形方面的应用能力 MMX 57条多媒体指令 SSE 3D NOW! 3D加速指令集 怎么利用这些指令 用专业编译器 2 多核技术是处理器发展的必然 推动微处理器性能不断提高的因素 半导体工艺技术的飞速进步 体系结构的不断发展 这两个因素相互影响,相互促进 工艺和电路技术的发展使得处理器性能提高约20倍 体系结构的发展使得处理器性能提高约4倍 编译技术的发展使得处理器性能提高约1.4倍。 如今,这个规律已经很难维持 十亿晶体管时代即将到来 通用微处理器的主频已经突破了4GHz 数据宽度也达到64位。 65nm工艺的微处理器已经批量生产 大连 45nm工艺以下的微处理器也已问世 芯片上集成的晶体管数目已经超过10亿个 如何有效地利用数目众多的晶体管? 多核 通过在一个芯片上集成多个简单的处理器核 利用这些晶体管资源 发挥其最大的能效 门延迟逐渐缩短,全局连线延迟却不断加长 晶体管特征尺寸不断缩小 使得晶体管门延迟不断减少 互连线延迟却不断变大 芯片的制造工艺达到0.18微米甚至更小时 线延迟已经超过门延迟 成为限制电路性能提高的主要因素 CMP(单芯片多处理器)的分布式结构 全局信号较少,与集中式结构的超标量处理器结构相比,在克服线延迟影响方面更具优势 符合Pollack规则 Pollack规则 处理器性能的提升与其复杂性的平方根成正比 如一个处理器的硬件逻辑提高一倍,至多能提高性能40% 采用两个简单处理器构成一个相同硬件规模的双核处理器 可获得70%~80%的性能提升 在面积上也同比缩小 能耗不断增长 芯片的发热现象日益突出 工艺技术的发展和芯片复杂性的增加 多核处理器 单核速度较慢 处理器消耗较少的能量,产生较少的热量 单核处理器里增加的晶体管可用于增加多核处理器的核 多核处理器关闭(或降频)一些处理器等低功耗技术 设计成本的考虑 设计成本随时间呈线性甚至超线性的增长 处理器结构复杂性的不断提高 人力成本的不断攀升 多核处理器 处理器IP复用 极大降低设计的成本 模块的验证成本也显著下降 体系结构发展的必然 超标量结构和超长指令字结构 在目前的高性能微处理器中被广泛采用 超标量结构 使用多个功能部件同时执行多条指令,实现指令级的并行 控制逻辑复杂,实现困难 超标量结构的指令并行程度一般不超过8 超长指令字结构 使用多个相同功能部件执行一条超长的指令 编译技术支持问题 二进制兼容问题。 未来的主流应用需要同时执行更多条指令的能力 单一线程不太可能提取更多的并行性 不断增加的芯片面积提高了生产成本 设计和验证所花费的时间变得更长 更复杂化的设计也只能得到有限的性能提高 单芯片多处理器通过在一个芯片上集成多个微处理器核心来提高程序的并行性 每个微处理器核心是一个相对简单的单线程微处理器或者比较简单的多线程微处理器 多个微处理器核心就可以并行地执行程

文档评论(0)

130****9768 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档