计算机体系结构作业一.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机体系结构作业一

计算机体系结构第一次报告 1. Brief of your research field 2. Name of the benchmarks in your research field 3. List of program of the benchmark and brief for each program 研究方向 我的研究方向是高性能计算(High Performance Compute),一般分为以下几个大方面: 并行计算(Parallel Computing) 高端计算(High-end Parallel Computing) 高性能计算(High Performance Computing) 超级计算(Super Computing)。 高性能计算 HPC 指通常使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计图1.HPC 总线网络拓扑算资源操作)的计算系统和环境。有许多类型的HPC 系统,其范围从标准计算机的大型集群,到高度专用的硬件。 大多数基于集群的HPC系统使用高性能网络互连,比如那些来自 InfiniBand 或 Myrinet 的网络互连。基本的网络拓扑和组织可以使用一个简单的总线拓扑,在性能很高的环境中,网状网络系统在主机之间提供较短的潜伏期,所以可改善总体网络性能和传输速率。 图(1) 高性能计算结构模型 高性能计算的benchmarks Linpack 高斯消元法求解线性代数方程组。 NPB(NAS Parallel Benchmark) 美国NAS项目开发,包含8个空气动力学计算类应用,测试范围从整数排序到复杂的数值计算。 LAPACK ScalLAPACK 稠密、带状矩阵之上的各类操作。 Perfect、 SPLASH 、ParkBench List of program of the benchmark and brief for each program 1) Linpack用于测试高性能计算机系统浮点性能的benchmark。通过利用高性能计算机,用高斯消元法求解N元一次稠密线性代数方程组的测试,评价高性能计算机的浮点性能。 Linpack测试包括三类: 1、Linpack100求解规模为100阶的稠密线性代数方程组,它只允许采用编译优化选项进行优化,不得更改代码,甚至代码中的注释也不得修改。 2、Linpack1000要求求解规模为1000阶的线性代数方程组,达到指定的精度要求,可以在不改变计算量的前提下做算法和代码上做优化。 3、HPL即High Performance Linpack,也叫高度并行计算基准测试,它对数组大小N没有限制,求解问题的规模可以改变,除基本算法(计算量)不可改变外,可以采用其它任何优化方法。HPL是针对现代并行计算机提出的测试方式。用户在不修改任意测试程序的基础上,可以调节问题规模大小N 矩阵大小 、使用到的CPU数目、使用各种优化方法等来执行该测试程序,以获取最佳的性能。HPL采用高斯消元法求解线性方程组。当求解问题规模为N时,浮点运算次数为 2/3 * N^3-2*N^2 。因此,只要给出问题规模N,测得系统计算时间T,峰值 计算量 2/3 * N^3-2*N^2 /计算时间T,测试结果以浮点运算每秒(Flops)给出。 2)NPB 1、EP Embarrassingly parallel 用于计算Gauss 伪随机数,因为它几乎不要求处理器之间相互通讯,所以很适合于并行计算,而所测得的结果往往可以作为一个特定并行系统浮点计算性能可能达到的上限; 2、MG MultiGrid :用4个V循环多重网格算法求解三维波松方程的离散周期近似解; 3、CG Conjugate Gradient :用于求解大型稀疏对称正定矩阵的最小特征值的近似值,它表征了非结构风格计算和非规整远程通信计算类问题: 4、FT Fast Fourier Transformation :用于求解基于FFT谱分析法的三维偏微分方程,它也要求远程通信; 5、IS Integer sort :用于基于桶排序的二维大整数排序,他要求大量的全交换通信。 另外还有计算流体力学中3个模拟程序: 1、LU lower upper triangular :用于基于对称超松弛法求解块稀疏方程组; 2、SP scalar penta-diagonal :用于求解5对角线方程组; 3、.BT Block Tri-Diagonal : 用于求解3对角块方程组。 3)LAPACK ScalLAPACK ScaLAPACK是LAPACK的增强版,主要为可扩放的,分布存储的并行计算机而设计的。ScaLAPACK支持稠密和带状矩阵上各类操作,诸如乘法,转置和

文档评论(0)

bigone123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档