暑期学习报告.pptVIP

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
暑期学习报告

开发人员与研究人员的灵活需求 希望系统做到 希望灵活使用定制的系统与新型软件(甚至是不成熟的软件与系统) 不同运行时系统的快速部署 能够方便地访问到集群中的各种计算资源 系统避免: 不时进行系统重装,在新旧系统间进行切换 用户之间相互干扰 对于用户和管理者来说,集群的管理和使用是一个亟待解决的问题 * * 挑战2: 系统管理 基于虚拟机的解决方法 基于虚拟机的高性能计算集群管理与调度方法 能够为不同的用户方便地提供不同的环境 虚拟集群的界面 单个虚拟机的操作界面: create, start, suspend, resume, stop, delete 虚拟集群的操作界面: create, start, suspend, resume, stop, delete * * 挑战2: 系统管理 需要解决的问题 虚拟机带来的开销问题 众多虚拟机镜像的有效存储 虚拟化为大规模系统的管理提供了一个灵活的解决方案 * 挑战4: 调试 * 调试HPC程序的困难 进程数多 分布在不同的节点 运行时间长 串行程序的所有bug 并行程序引入的bug deadlock, data-race, non-determinism… 语义错误 消息不匹配, 缓冲区非法重用… * 挑战3:调试 调试技术 静态分析 动态监测 Trace分析 记录重播 其它 * 哪种最好? No Silver Bullet!(没有仙丹!) 各种技术相辅相成 * 挑战3:调试 * 挑战5:性能预测 在高性能计算机的研制方面,国际竞争非常激烈 十一五期间,我国立项研制千万亿次计算机系统 千万亿次计算机系统规模巨大,为系统的研制和使用提出了新的挑战 * BlueGene/L系统 全过程评测 * 结论和下一步工作 大规模并行程序的性能预测是一个复杂的问题 我们采用结合编译器和模拟器实现性能预测 提出基于Live变量的通信模式自动提取方法 可以在小规模系统上得到更大规模的通信模式 利用现有的万亿次机器来预测将来设计的系统 下一步工作: 研究如何获得精确的计算时间在小规模的系统上对大规模的并行程序 * * 挑战4:性能预测 挑战 6: 编程 未来的计算机架构有多种发展方向 少量强大的处理器核心( Intel/AMD, 2,3,4,6 …) 大量简单处理器( nVidia, ATI, Larrabee, 32/128/196/256 … ) 异构处理器( CELL, 1/8; FPGA… ) 在这些架构上编程并不容易 识别并行性 同步 负载均衡 局部性优化 容错 2009/6/30 * 挑战 5: 编程 没有有效的解决方案 目前有很多编程模型 OpenMP, MPI CUDA, OpenCL, Brooks, CTM, Ct Verilog, System C MapReduce 但是这些模型都不能有效的解决异构多核结构的编程问题 可移植性 性能 易编程性 2009/6/30 挑战 5: 编程 * 挑战7:功耗 * 晶体管在不断变小 摩尔定律继续生效 然而 用电效率! 时钟频率不可扩展 传统提高性能的方法已被充分开发 难以预料新的体系结构能否冲破功耗墙 * 提高并行度,降低功耗 降低频率可以三次方速度降低功耗 低频率可用简单的处理器 简单的处理器芯片面积小,漏电少,成本低 面向应用定值处理器可减少浪费 每个核心性能下降: 1/10 核心数目增多: 100X (总性能持平) 总功耗大幅下降: 1/20 * * 挑战6:功耗 挑战8: Cache 一致性 三种Cache一致性策略 采用Write-Through策略的Cache 采用Write-Back策略的Cache 采用Write-Once策略的Cache * Thanks! 祝大家节日快乐! * * * * * * * * * From: /presentations/Germany/EnergyandComputing_Stgt.pdf * 学习报告 张翼 * From:并行计算及其挑战 郑纬民 教授 zwm-dcs@ 清华大学计算机系 * 提纲 什么是并行处理 为什么要开发并行处理技术 并行处理计算机结构沿革 8大挑战 * 什么是并行处理 几个术语 同时性(simultaneity) 两个或多个事件在同一时刻发生。 并发性(concurrency) 两个或多个事件在同一时间间隔内发生。 流水特性(pipelining) 在一个重叠的时间内所发生的流水事件。 * 按粒度的不同,并行性级别可以分为 指令级并行 循环级并行 过程级并行 子程序级并行 作业级并行 * 为什么要开发并行处理技术 基础科研领域的计算 物理 化学 生物 材料 工业领域 银行 辅助设计 医药 石油 气象 在线服务 信息

您可能关注的文档

文档评论(0)

dlhss + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档