- 1、本文档共96页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北师大培训
Speedup and Network comparison Operation mode Run times Open-MP 519.276 Seconds Linda ( IB) 776.541 Seconds 1×NF5280M3( Use OpenMP to run the Gaussian,using 16 CPU for each node ) 2×NF5280M3(Use Linda to run the Gaussian,using 8 CPU for each node) The chart shows the comparison of Gaussian example’s running time on the TS850 and NF5280M3 platform Dark grey represents the case of TS850, while the light grey represents the case of NF5280M3, Results show that TS850 platform can exhibit good performance characteristics for Gaussian platform Run characteristics on E5-2670 Platform CPU:Higher CPU coefficient of utilization, nearly 100%; Gflops: Maximum peak is 160Gflops, High requirement on the CPU frequency; Memory: little memory bandwidth 15Gb/s higher performance Disk IO:High requirement high data to storage and communicate, only at the initial and the final of program running need the data to read the files; The Gaussian characteristic summary Computationally intensive:Higher CPU frequency higher performance Storage IO: High requirement Need high disk space to storage data Network: High requirement high data to storage and communicate Memory band-width sensitive:little memory bandwidth higher performance 诚信﹒尊重﹒追求卓越 * * * SMP具有如下特征: 对称共享存储:系统中任何处理器均可直接访问任何存储模块中的存储单元和I/O模块联接的I/O设备,且访问的延迟、带宽和访问成功的概率是一致的。所有内存地址单元统一编址。各个处理器之间的地位等价,不存在任何特权处理器。操作系统可在任意处理器上运行。 单一的操作系统映像:全系统只有一个操作系统驻留在共享存储器中,它根据各个处理器的负载情况,动态地分配各个进程到各个处理器,并保持各处理器间的负载平衡。 局部高速缓存Cache及其数据一致性:每个处理器均配备局部Cache,它们可以拥有独立的局部数据,但是这些数据必须保持与存储器中数据是一致的。 低通信延迟:各个进程通过读/写操作系统提供的共享数据缓存区来完成处理器间的通信,其延迟通常小于网络通信的延迟。 共享总线带宽:所有处理器共享总线的带宽,完成对内存模块和I/O模块的访问。 支持消息传递、共享存储并行程序设计。 SMP具有如下缺点: 欠可靠:总线、存储器或操作系统失效可导致系统崩溃。 可扩展性(scalability)较差:由于所有处理器共享总线带宽,而总线带宽每3年才增加2倍,跟不上处理器速度和内存容量的增加步伐,因此,SMP并行机的处理器个数一般少于32个,且只能提供每秒数百亿次的浮点运算性能。 SMP典型代表: SGI POWER Challenge XL系列并行机(36个MIPS R1000微处理器); COMPAQ Alphaserver 84005/440 (12个Alpha 21264个微处理器); HP9000/T600 (12个HP PA9000微处理器); IBM RS6000/R4
文档评论(0)