天津大学并行计算3.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
天津大学并行计算3

内存系统,多线程 于策 17/2/28 /orgs/hpclab/ China Research Laboratory Outline §  内存系统对性能的影响 § 多线程基本概念 § Pthread多线程 § 实例分析 – 计算数组中“3”出现的次数 17/2/28 /orgs/hpclab/ China Research Laboratory Outline §  内存系统对性能的影响 § 多线程基本概念 § Pthread多线程 § 实例分析 – 计算数组中“3”出现的次数 17/2/28 /orgs/hpclab/ China Research Laboratory 内存系统对性能的影响 § 对于很多应用而言,瓶颈在于内存系统,而不是CPU §  内存系统的性能包括两个方面:延迟和带宽 – 延迟:处理器向内存发起访问直至获取数据所需要的时间 – 带宽:内存系统向处理器传输数据的速率 17/2/28 /orgs/hpclab/ China Research Laboratory 延迟和带宽的区别 §  考虑消防龙头的情形。如果打开消防龙头后2秒水才从消防水管 的尽头流出,那么这个系统的延迟就是2秒。 §  当水开始流出后,如果水管1秒钟能流出5加仑的水,那么这个 水管的“带宽”就是5加仑/秒。 §  如果想立刻扑灭火灾,那么更重要是减少延迟的时间。 §  如果是希望扑灭更大的火,那么需要更高的带宽。 17/2/28 /orgs/hpclab/ China Research Laboratory 内存延迟示例 § 考虑某一处理器以1GHz (1纳秒时钟)运行,与之相连 的DRAM有100纳秒的延迟(没有高速缓存)。假设处 理器有两个multiply-add部件,在每1纳秒的周期内能执 行4条指令。 – 处理器的峰值是4GFLOPS 。 –  由于内存延迟是100个周期,并且块大小为一个字 (word ),每次处理内存访问请求时,处理器必须要等待 100个周期,才能够获得数据。 17/2/28 /orgs/hpclab/ China Research Laboratory 内存延迟示例 § 在以上平台上,考虑计算两个向量点积的问题。 – 计算点积对每对向量元素进行一次乘法-加法运算,即每 一次浮点运算需要取一次数据。 – 此计算的峰值速度的限制是,每100纳秒才能够进行一次 浮点计算,速度为10MFLOPS,只是处理器峰值速度的很 小一部分。 17/2/28 /orgs/hpclab/ China Research Laboratory 使用高速缓存改善延迟 § 高速缓存是处理器与DRAM之间的更小但更快的内存 单元 – 低延迟高带宽的存储器 § 如果某块数据被重复使用,高速缓存就能减少内存 系统的有效延迟 §  由高速缓存提供的数据份额称为高速缓存命中率(hit ratio ) – 高速缓存命中率严重影响内存受限程序的性能 17/2/28 /orgs/hpclab/ China Research Laboratory 高速缓存 17/2/28 /orgs/hpclab/ Ch

文档评论(0)

feixiang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档