多核架构及编程技术.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

魏博文数计学院学号:1315063011

多核所属体系---并行计算体系并行计算机是由一组处理单元组成的,通过相互之间的通信与协作,以更快的速度共同完成一项大规模的计算任务。20世纪60年代初,晶体管以及磁芯存储器的出现,处理单元变得越来越小,存储器也更加小巧和廉价。这些技术导致了并行计算机的出现。这一时期的并行计算机多是规模不大的共享存储器系统,例如IBM360。二十世纪70年代末期,同一个处理器开始设置多个功能相同的功能单元,流水线技术也出现了。这些并行特性的应用大大提高了并行计算机系统的性能。0102

并行计算机的分类Flyrm根据指令流和数据流的不同组织方式,把计算机系统的结构分为以下4类:单指令流单数据流(SingleInstructionstreamSingleDatastream,SISD)单指令流多数据流(SingleInstructionstreamMultipleDatastream,SIMD)多指令流单数据流(MultipleInstructionstreamSingleDatastream,MISD)多指令流多数据流(MultipleInstructionstreamMultipleDatastream,MIMD)指令流是指机器执行的指令序列,数据流是指指令流调用的数据序列,包括输入数据和中间结果。

并行是个广义的概念,并行是一个广义的概念,根据实现层次的不同,可以分为几种方式。

从系统结构的角度,并行计算机目前有以下几种:1)分布式存储器的SIMD处理机。含有多个同样结构的处理单元(PE),通过寻径网络以一定方式互相连接。2)向量超级计算机(共享式存储器SIMD)。集中设置存储器,共享的多个并行存储器通过对准网络与各PE相连。3)对称多处理器(SMP)。一个计算机上汇集了一组处理器,各处理器之间共享内存子系统以及总线结构。4)并行向量处理机(PVP)。有专门定制的向量处理器,通过向量处理和多个向量处理器并行处理两条途径来提高处理能力。5)集群计算机。随着微处理器和网络技术的进步而逐渐发展起来的,它主要用来解决大型计算问题。是一种并行或分布式处理系统,由很多连接在一起的独立计算机组成,像一个单集成的计算机资源一样协同工作。6)网格计算是伴随着互联网技术而迅速发展起来的,专门复杂科学计算的新型计算模式。

并行计算机与超级计算机技术,为多核计算机的出现奠定了基础。集成电路的进步也为多核芯片提供了物理条件。1多内核是指在一枚处理器中集成两个或多个完整的计算引擎(内核)。多核技术的开发源于工程师们认识到,仅仅提高单核芯片的速度会产生过多热量且无法带来相应的性能改善,先前的处理器产品就是如此。他们认识到,在先前产品中以那种速率,处理器产生的热量很快会超过太阳表面。即便是没有热量问题,其性价比也令人难以接受,速度稍快的处理器价格要高很多。2多核处理器

现代计算机------转向多内核方向发展的原因

从功耗角度看多核

美国IT公司多核处理器的发展

多核处理器架构下几个显著的优点*控制逻辑简单:相对超标量微处理器结构和超长指令字结构而言,单芯片多处理器结构的控制逻辑复杂性要明显低很多。*高主频:由于单芯片多处理器结构的控制逻辑相对简单,包含极少的全局信号,因此线延迟对其影响比较小,因此,在同等工艺条件下,单芯片多处理器的硬件实现要获得比超标量微处理器和超长指令字微处理器更高的工作频率。*低通信延迟:由于多个处理器集成在一块芯片上,且采用共享Cache或者内存的方式,多线程的通信延迟会明显降低,这样也对存储系统提出了更高的要求。*低功耗:通过动态调节电压/频率、负载优化分布等,可有效降低CMP功耗。*设计和验证周期短:微处理器厂商一般采用现有的成熟单核处理器作为处理器核心,从而可缩短设计和验证周期,节省研发成本。

多核架构下的编程技术多核架构下的多线程程序设计与传统的单核下的多线程程序设计有着一定的差别,在单CPU下,是多个线程在同一个CPU上并发地执行,而在多核下,则是由多个线程在多个核上并行地执行。目前的程序设计中对于多核的利用并没有达到预期的效果。要做到这一点,就必须将应用程序看作是众多相互依赖的任务的集合,将应用程序划分成多个独立的任务,并确定这些任务之间的相互依赖关系,这就称为分解(decomposition)。

任务分解:对应用程序根据其执行的功能进行分解的过程称为任务分解阳(taskdecomposition)。根据这种方法,就能够对众多的独立的任务进行分类。如果其中两个任务能够同时运行,那么开发人员就应该对其进行调度,形成二者之间的并行执行。数据分解:数据分解也称为数据级并行(data-levelparallelism)。是将应用程序根据各个任务所处理的数据而非按

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档