- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
并行程序设计Chapte的r-1H
二、性能度量(1/2) ① 执行时间(execution time) 完成一个并行计算所花费的时间 另一个常用指标 FLOPS(floating-point operations per second):浮点运算次数/秒 1GFlops = 109次浮点运算/秒,10亿次 1TFlops = 1000GFlops,万亿次 1PFlops = 1000TFlops,千万亿次 1EFlops = 1000PFlops,百亿亿次 常用做衡量处理器和并行计算机计算性能的指标 峰值性能(peak performance):理想状态可达到的最高性能 应用性能:应用程序实际运行获得每秒浮点运算次数 常用有代表性的基准测试程序,如Linpack、Lapack、NPB等 不同处理器指令系统有差异性, MIPS(million instructions per second)指标难以客观地反映处理器计算性能 1.3 并行性与程序性能 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 二、性能度量(2/2) ② 加速比(speedup) 常用来衡量并行加速的效果,以及随处理器/任务数增长的变化情况 超线性加速比(superlinar speedup) 某些情形下,计算能获得超过线性的加速比 大多是由于并行后每节点访问的数据集变小,cache命中率提高 加速比(speedup)是度量一个并行程序性能和可扩展性的常用指标 1.3 并行性与程序性能 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 第一章 概 述 刘 轶 北京航空航天大学 计算机学院 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 1.1 并行化的现状与未来 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 1.1 并行化的现状与未来 一、并行的威力和潜力 并行的目的 加快计算速度 传统程序中的并行性 大多数编程语言的语义体现为顺序执行 程序都假设指令是按顺序执行的 提升串行程序性能的方法:隐式并行(hidden parallelism) 为加快程序执行速度,在程序执行过程中部分操作被并行执行,并对程序透明 指令级并行(ILP—Instruction Level Parallelism) 举例:计算(a + b) * (c + d)时,(a+b)和(c+d)可以分别并行计算 隐式并行由编译和系统结构支持 多级流水、多发射、乱序执行、… 问题:隐式并行的发掘有极限,支持隐式并行的处理器硬件也存在极限 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 二、多核处理器带来的问题 摩尔定律(Moore’s Law) Intel公司创始人Gordon Moore首先提出 主要内容:集成电路上可容纳的晶体管数目大约每18个月增加一倍 通常认为,其集成电路性能每18个月也增加一倍 摩尔定律从1960年代延续至今 摩尔定律并不是科学定律,而是技术-经济定律 摩尔定律在很大程度上推动了包括计算机技术在内的信息技术的发展 摩尔定律还能走多远? 在可预见的10~15年仍将延续 新材料、新工艺、… 1.1 并行化的现状与未来 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 在单核处理器时代,提升处理器性能的主要方法: 提升主频 1978:8086 5MHz 2005:P4 3.2GHz 多种指令级并行技术(ILP—Instruction level Parallelism) 多级流水、多发射和乱序执行(out-of-order execution)等 占用了大量硅片面积 增加c
您可能关注的文档
- 对弧长曲线积分的.ppt
- 对条约的保留的.pdf
- 对标企业分析的.ppt
- 对称式共享存储器体的系结构.ppt
- 对经营者利用广告或的其他方式对商品或服务作引人误解虚....doc
- 对话框创建和使用的.ppt
- 对象及对象的三要素的.ppt
- 对阅读教学的几点建的议.1ppt.ppt
- 导出动画流程的.doc
- 导尿管相关泌尿道感的染的预防策略(2014 更新版).doc
- 2024年沧州市公务员考试行测真题及答案详解(名师系列).docx
- 粮油食品检验人员复习提分资料带答案详解(精练).docx
- 粮油食品检验人员自我提分评估(考点精练)附答案详解.docx
- 粮油食品检验人员全真模拟模拟题附参考答案详解(精练).docx
- 2025年延安市公务员考试行测试卷历年真题附答案详解(突破训练).docx
- 2025年株洲市公务员考试行测试卷历年真题含答案详解.docx
- 2024年枣庄市公务员考试行测真题及完整答案详解1套.docx
- 2024年抚顺市公务员考试行测真题及答案详解(各地真题).docx
- 2025年常州市公务员考试行测真题及一套参考答案详解.docx
- 2023年德州市公务员考试行测试卷历年真题及1套完整答案详解.docx
最近下载
- 林伟贤-魅力口才第1-40集全.ppt
- 海上油气集输油气混输管道浅析.pptx
- 广东省2024年本科普通类(历史)投档情况.pdf VIP
- 路堑高边坡安全专项施工方案.docx VIP
- deform v11安装教程注意前先退出安全管家之类杀毒软件以免过程中拦.pdf VIP
- trnsys太阳能系统详细案例.ppt VIP
- 可摘局部义齿修复工艺技术 第四章 可摘局部义齿的设计及制作流程 第四章 可摘局部义齿的设计及制作流程.pptx VIP
- 卫生巾营销策划方案.doc VIP
- PE聚乙烯焊工考试试卷.doc VIP
- 2025河南工业大学招聘非事业编(人事代理)12人笔试模拟试题及答案解析.docx VIP
文档评论(0)