高级计算机体系结构-1-续-2012.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Amdahl定律 To T1 T2 Te Amdahl定律练习 例2:求平方根和浮点乘是图形应用中常用的转换,假设求平方根操作在某机器的一个基准程序中占总执行时间的20%,浮点乘操作在该程序中占总执行时间30%,现通过两种方法加速两操作:①增加专门的硬件处理求平方根,使其执行速度为原来的10倍;②通过调整流水线把浮点乘速度提高为原来的1.6倍。 问:采用两种方法增强后此基准程序加速比是多少? Amdahl定律练习 30% 20% 加速比= 增强前时间/增强后时间 =1/(0.5+0.2/10+0.3/1.6) =1/0.7075 =1.41 =1/((1-0.3-0.2)+0.2/10+0.3/1.6) 阿姆达尔定律 阿姆达尔定律的例子 处理机性能公式 CPU的性能 将程序执行的时间进行分解。 将计算机系统中与实现技术和工艺有关的因素提取出来。这个因素就是计算机工作的时钟频率(f),单位是MHz 可以测量执行程序使用的总时钟周期数(CLK) 通过这两个参数我们就可以知道程序执行的CPU时间: A C B SUM SEL + D Op1 Op2 + × 3ns 7ns CPU的性能 程序执行过程中所处理的指令数,记为IC。 每条指令执行所需要的时钟周期数CPI (Cycles Per Instruction):每条指令执行所需要的平均时钟周期数。 CPU性能公式 时钟周期时间 CPU性能公式和体系结构 时钟频率(f ):反映了计算机实现技术、生产工艺和计算机组织。 指令的平均时钟周期数(CPI ):反映了计算机组织和计算机指令集的结构。 程序的指令数(IC ):反映了计算机指令集的结构和编译技术。 A C B SEL + D Op1 Op2 + × 3ns 7ns SUM R E G R E G R E G A C B SEL + D Op1 Op2 + × 3ns 7ns SUM R E G 深入CPU性能公式 假设计算机系统有n 种指令,其中第i 种指令的处理时间为CPIi ,在程序中第i 种指令出现的次数为ICi 。 深入CPU性能公式 其中: 反映了第i种指令在程序中所占的比例。 改变各因素的技术是相互关联的 时钟周期 由硬件技术和计算机组成决定 CPU 由计算机组成和指令系统结构决定 指令数 由指令系统结构和编译技术决定 几个应用例子 1.10 综合:性能和性价比 桌面计算机和机架式系统的性能和性价比 价格上的差异由以下因素造成: 处理器价格 操作系统差异 系统的可扩展性 商品效应 事务处理服务器的性能和性价比 性能和性价比-1 性能和性价比-2 1.11 谬误和易犯的错误 无视Amdahl定律 单点故障 处理器的成本在系统成本中占支配地位 基准测试程序永远有效 磁盘测定的评价故障时间为1200000小时或接近140年,因此在实际中磁盘永远不可能停止运转 峰值性能体现实际性能 故障检测会降低可用性 易犯的错误 结论 CPU时间 离散事件时间 指令路径长度 时钟周期、CPI、指令数 范例分析及习题 * * Slicer:切割机,wafer:晶圆,dicer:切割 die:裸芯片 * * * 真实程序:依赖于操作系统或编译器的可移植问题,增强可移植性通常意味着修改源程序,可能会去掉一些重要的东西(如非常依赖系统的交互式图形界面) 核心:为评价机器的性能,将机器的各项功能的性能分离出来,以解释运行真实程序时性能由差异的原因。Livermore loops、linpack。 综合(合成)测试程序:取大量程序使用的指令数和操作数的平均值,人工拼凑出来,Whetstone/Dhrystone * * SPEC CPU2000: C编译器核心、VLSI布局布线(定点);量子色动力学、有限元模型和流体力学(浮点) SPECviewperf等:3D模型应用(飞机模型) TPC-x:机票预定系统、银行ATM EEMBC:汽车工业领域(指针跟踪、矩阵算法、滤波、FFT);消费电子(JPEG压缩解压、滤波); 办公自动化(图形和文本基准,Bezier曲线、抖动、图像旋转和文本处理); 电信(滤波、DSP等) * * 两个不同的方面,注意区分,两者的关系并不是水涨船高。 * * 注意时间和空间的区分。 * * 普适原则,但在体系结构设计中经常体现。例如:溢出的处理。 * * 频率怎样反应工艺?在结构、实现等都确定的前提下,工艺的进步会使频率成比例增加。 * * 组织和实现技术:流水线与非流水实现。 * * 细化:每种指令处理时间不同。 * * 量化的准则:所有参量都比例化,以消除绝对数量

文档评论(0)

136****1820 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档