- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
异构并行工作站机群系统的性能评价指标
计算机研究与发展COMPUTERRESEARCHDEVELOPMENTVol135,No13Mar.1998第35卷第3期1998年3月异构并行工作站机群系统的性能评价指标申俊郑纬民(清华大学计算机科学与技术系北京100084)摘要文中在对矩阵乘法进行实验研究的基础上,分析了异构性对工作站机群系统性能的影响,描述了异构性的数学模型,扩展了加速比和效率等性能指标的定义,使之能同时适用于同构、异构两种并行系统的性能评价.关键词并行计算,异构性,加速比,效率中图法分类号TP302MODELINGPARALLELCOMPUTINGPERFOR-MANCEFORHETEROGENEOUSWORKSTATIONCLUSTERSShenJunandZhengWeimin(DepartmentofComputerScienceandTechnology,TsinghuaUniversity,Beijing100084)AbstractSpeedupandefficiencyarewidelyusedtoevaluatetheperformanceofparallelcomputingsystems.However,theyworkwellonlyinhomogeneousparallelsystems.Theintroductionofheterogeneityinworkstationclustersmakesthemnotsuitableforparallelcomputing.Tocopewiththisproblem,theheterogeneityofworkstationclustersisquantified,andthespeedupandeffi2ciencyareredefinedonthebasisoftwomatrixmultiplicationexperiments.Thesenewmodelsaregeneralenoughtocoverperformanceevaluationofbothhomogeneousandheterogeneouscomputa2tions.Keywordsparallelcomputing,heterogeneity,speedup,efficiencyClassnumberTP302引言1并行计算机系统通常使用加速比、效率两个指标对其性能进行评价,但这些性能指标是在系统同构的条件下定义的.只有当组成系统的机器性能基本一样,并行算法的负载基本平衡时,它们才能比较有效地分析并行系统、并行算法的通信开销以及负载分配策略对系统的影响.由于过去使用的并行系统,如SMP,MPP多数是同构并行系统,因此这些定义一直被广泛使用.但是随着工作站机群系统的兴起和推广,而这种系统原稿收到日期:1996211205;修改稿收到日期:1997203220.本课题得到国家“863”高科技计划基金资助.申俊,博士研究生,主要从事并行机群系统通信技术的研究.郑纬民,教授,博士生导师,主要从事并行机群系统及多机处理技术的研究.2矩阵乘法实验研究我们的实验系统是一个由10Mb?s以太网构成的机群系统,系统上有三种工作站:8台SPARC20、2台RS6000?530和2台RS6000?590.在这个系统上我们实现了两种不同的并行矩阵乘法:一种是负载平均分配算法,这种算法是为了分析同构、异构对加速比性能的影响;另一种是负载平衡算法,它主要用于分析负载平衡对提高异构机群系统效率的作用.2.1负载平均分配算法在一个由m台工作站组成的机群系统上,运行n×n矩阵并行乘法运算,可把这两个n×n矩阵A和B按水平方向均匀分成m块,分别放在m个结点上,如图1所示,假设n%m=01,2.当处理机Pi计算完Ai×Bi后,把Bi发送给下一个结点Pi+1,并等待接收上一个结点Pi-1送来的数据作为新的Bi,再计算Ai×Bi.这样的过程重复m-1次,于是每个结点上都得到了矩阵乘的部分和.最后各结点把部分和汇总到master结点上.我们用这种算法运行一个600×600双精度矩阵乘法,矩阵乘法的数据规模不大于10M,保证算法对内存的图1并行矩阵乘法要求在三种工作站的内存范围之内.所得到的实验数据如表1、表2和表3所示.表1单机执行时间表22结点执行时间表34结点执行时间2.2负载平衡算法从上面的实验数据看,负载平均分配策略在异构系统上得到的效果较差,其关键原因在于系统中性能最慢的结点成了整个并行计算的瓶颈.如果采用负载平衡策略,其效果又会如何?为此我们设计了一种简单的负载平衡算法,其基本思路是根据各结点机的相对运算速度确定在每一结点上分配的进程数,性能越好的机4台SPARC202台SPARC202台RS6000?5302台SPARC202台RS600
文档评论(0)