并行计算机体系结构课件.pptVIP

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第二章并行计算机系统的性能度量

并行算机系的性能度量?硬件效率、各功能部件之间的性能平衡?软件效率?软硬件和需求之间的性能匹配。?理想的系统应该是无瓶颈的平衡系统、结构支持应用,应用适应结构?理想的计算机是为应用量身定制的计算机

并行算机系的性能度量?衡量计算机性能的指标计算速度、存储容量、响应时间、通信带宽和系统吞吐率、每条指令的平均执行时间为了降低计算机成本,我们通过硬件功能的软化实现,比如我们将视频解压卡换为信息解压软件。

2.1算机速度?计算机通过运行程序来完成工作。?不能用一段程序的运行时间来衡量计算机的性能,往往一段程序的运行与它跟计算机适应的程序相关?为了客观综合描述计算机系能,我们往往用大量程序运行的运行速度进行衡量,或者我们还可以用所谓的制定运行库来衡量计算机性能。

2.1算机速度?为了定量讨论机器速度,定义下列参数Ic:给定程序的指令数ζ:时钟周期T:给定程序的执行时间。f=1/ζ:时钟频率TFU:功能部件时间常数,一般为功能部件的流水线段数+2.CPI:执行每条指令的平均周期数。IPC=1/CPI:平均每拍流出的指令数。

2.1算机速度?指令条数Ic的程序的执行时间为T=Ic*CPI*ζ。?指令的执行:取指令、指令译码、取操作数、操作、存操作数。指令部件和功能部件协同完成。?在流水线中,指令流出时就完成了译码,所以每条指令有一个与操作相关的功能部件时间常数和数据传送的最小执行周期数。对R-R型指令,CPI=TFU。

2.1算机速度?对m-m型指令,CPI=TFU+mk。其中k为存储器周期与时钟周期之比,m为访存次数。?当访存出现冲突时,导致CPI增加。

2.1算机速度?T=Ic*(TFU+mk)*ζIc:与应用程序、指令系统和编译有关;ζ:机器主频的倒数。受限于指令功能的复杂程度、器件的水平和采用的技术,与指令系统和实现技术有关m:与存储系统结构和访存指令类型有关k:与存储器结构、实现技术和ζ有关。TFU:与指令功能、实现技术和ζ有关。

2.1.1MIPS、Flops和PDR?MIPS速率设C为执行已知程序的时钟周期数。则T=C*tMIPSM指令/秒。MIPS=I/(T*106)=f/(CPI*10)6MIPS与时钟频率成正比,与CPI成反比计算机系统中的指令系统、编译器、处理器和存储技术对MIPS都有影响。

2.1.1MIPS、Flops和PDRMIPS提高MIPS的最有效的办法就是提高主频和每拍流出的指令条数。为提高主频:指令尽量简洁,功能实现的逻辑时间短,推动了RISC的发展为提高IPC:超长指令字,超标量和并行处理机。

2.1.1MIPS、Flops和PDRMflops:反映计算机每秒产生的结果数,不计指令仅计结果比MIPS公正。MIPS和Mflops都没有考虑机器的字长或数据的精度。但是精度与机器性能直接相关。

2.1.1MIPS、Flops和PDRPDR:对不同操作和字长加权后的每秒处理多少位数据。用以衡量计算机的速度PDR=L/R。L=0.85*定点指令位数+0.15*浮点指令数+0.4*定点数字长+0.15*浮点数字长R=0.85*定点加时间+0.09*浮点加时间+0.06*浮点乘时间

2.1.2SPEC和TPSSPEC:为了公正的评价计算机的性能,推出基准测试程序,用这些程序在被测机上运行的时间除对应程序的参考时间所得值的几何平均值就是所谓的SPEC分数值。SPEC主要针对处理器、存储器和编译性能的测试,不针对I/O和通信性能测试,尤其不适合于多机系统的性能评价。

2.1.2SPEC和TPSTPS:TPS评价更佳侧重于事务处理,单位时间内完成的交易。主要取决于计算机硬件的计算、I/O和通信速度,也取决于操作系统和数据库等软件性能。

2.2并行算机的速度算?并行化的应用程序在并行计算机上的执行时间最能反映并行系统的处理性能。?与系统提供的性能支持、应用程序特性、并行算法、并行程序和并行编译水平有关。?应能最大程度地利用并行系统中处理机资源,发挥其性能潜力。

2.2.1算平均速度

2.2.2和平均速度

2.2.3几何平均速度

2.3并行算机的加速比和效率?程序的并行性并行度:并行化程序在有p个处理机的系统上运行,使用的处理机的数目,为时间的函数,记作DOP(t)=p。t0-t1期间并行度的算术平均值,称为程序的并行性A。

2.3.2加速比通式加速比反映并行系统运行并行程序时系统并行能力发挥的程度。加速比定义为其中T(1)是程序在单处理机上执行完的时间,T(n)是程序以并行度i(i=P,其中P为处理机数目)并行执行完程序的时间。1=S(p)=P

2.3.2加速比通式多机运行过程中,一定会有多个计算机之间的通信设总工作量为W,并设程序中并行度为i的工作量为W

您可能关注的文档

文档评论(0)

173****6623 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体成都邻成友邻科技文化有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510100MADP1XFB4K

1亿VIP精品文档

相关文档