B10高性能计算现状与发展-河北大学高性能计算机中心.PPTVIP

B10高性能计算现状与发展-河北大学高性能计算机中心.PPT

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
B10高性能计算现状与发展-河北大学高性能计算机中心

* * * * * * 为了建立化学模型, 我们首先要了解各种化学模型的精度与适用范围, 这里我们给出了不同理论等级可计算的原子的个数, 以及其可计算与预测的性质. 一般在个人电脑上量子化学能准确计算的大概在不超过200个原子. 而且根据问题不同可计算体系会有很大不同. 目前最精确的计算还只限于几个原子的分子, 比如CASPT2. * * * * 所谓渲染农场(Renderfarm)其实就是“分布式并行集群计算系统”,它是一种利用现成的CPU、网络负载和操作系统构建的高性能超级计算机,它使用主流的商业计算机硬件设备达到或接近超级计算机的计算能力。集群(Cluster)指的是一组计算机通过通信协议连接在一起进行同一种服务,在客户端看来就像是只有一个计算机。集群可以利用多个计算机进行并行计算从而获得很高的计算速度,也可以用多个计算机做备份,从而使得任何一个机器坏了整个系统还是能够正常运行。它的目标是使用主流的硬件设备组成网格计算能力,达到、甚至超过超级计算机的计算性能。 有了这样的渲染农场,企业可以用最快的时间看到作品的质量,如果需要修改也不会浪费太多的时间,这样整个作品的渲染和产出都会很轻松的实现,同时不会影响企业里其他项目的进行。例如,800个计算核心的超高计算密度,理论计算峰值7.5万亿次。 一部全CG电影的总渲染时间是很恐怖的。通常2K电影分辨率所需要的渲染时间能被大家接受的大概在每帧1小时左右,而好莱坞主流电影的分辨率在2K、4K,甚至达到了6K或者8K,随着每一阶品质的提高而其渲染时间将是上一品质的4倍。如果场景还涉及到粒子、流体等复杂计算的时候,渲染的速度又会成倍提高,一帧画面的渲染时间可能在10小时以上。 * * * 计算系统: 曙光四路刀片服务器+曙光八路SMP胖节点服务器 网络系统: 20Gb Infiniband计算网络、FC光纤存储网络、万兆骨干网络、千兆管理网络 存储系统: Lustre并行文件系统、EMC存储盘阵 管理系统: GridView服务器综合管理系统,提供了机群状态监控、作业调度、告警管理、报表统计、机群管理、系统部署6大类机群管理功能 * * * * 所有的领域都可以用到C2050 * Nvidia Tesla C2050 与CPU对比 双精度浮点运算性能优势明显 X5650 CPU=2.66GHz×6核×(4flops/Hz)=64Gflops C2050 GPU=1.15GHz×448核=515.2Gflops 很多应用C2050实测性能远优于CPU 一 GPGPU 加速解决方案 ---提供更高的计算性能和能效比 6 cores X5650 C2050 C2050适用的领域 《gpuAutodock测试报告》 《GPU计算在理论化学领域的应用测试》 《Paradigm RTM测试(GPU)》 《TC3600平台下CUDA应用程序测试报告》 《W580I CUDA应用程序测试报告》 《A650-GP CUDA应用程序测试报告》 《某量子化学程序GPU移植评估报告》 《Lammps在GPU上应用测试报告》 《Gromacs GPU测试报告》 曙光在C2050上做的测试工作v Gromacs lmpl NAMD/VMD/IMD ApoA1重组蛋白体系优化 92224个粒子/1000步迭代 Lennard-Jones?potential Terachem DFT优化 Ansys Mechanical iray WRF 《Terachem GPU测试报告》 《双精度矩阵乘应用优化报告》 《bgp GPU加速项目报告》 《CPU/GPU异构系统优化介绍》 《千万亿次系统GPU算法优化介绍》 《CUDA编程开发与优化》 《OpenCL程序开发与优化》 《NAMD GPU测试报告》 ……………… 核心服务平台 模块管理 页面基础 认证授权 远程通信 配置管理 依赖管理 事件机制 第三方接口 运 维 层 信息监控 智能诊疗 自动预警 应 用 加 速 层 结构力学 气象海洋 数值计算 蛋白质分析 分子对接 电磁学 金融 信息安全 作业分发 作业调度 作业控制 硬 件 层 性能分析 资源管理 分子动力学 第一性原理 石油石化 流体力学 Clusmax是基于GPU的作业调度、系统监控管理、应用Portal、应用软件集成于一身的可定制的Gridview模块 曙光的GPGPU优势——应用整合 1 4 1. 单节点故障正在成为集群系统的常态 - 系统规模超过2000个节点,每天都存在节点死机的情况 - 系统越大,则故障点越多 3. 人们的关注点正在从“快算”变成“能算” - 一个需要使用1000节点任务,最多承受1天

文档评论(0)

ailuojue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档