- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于迭代聚类的并行应用性能分析方法-上海超级计算中心.PDF
50 《高性能计算发展与应用》 2013年第二期 总第四十三期
一种基于迭代聚类的并行应用性能分析方法
朱 鹏李 巍李云春
北京航空航天大学 网络技术北京市重点实验室 北京 100191cookpan001@
摘要:
随着超级计算机的发展,其使用到的核心数逐渐达到数十万,而且运行于其上的应用的复
杂性也不断加大。因此,开发人员需要对并行应用的性能进行测量,并做出分析,以便对程序
源码进行优化,提高程序的执行效率.但是由于核心数的大量增加,对并行程序性能进行测量将
得到海量的性能数据,如何处理海量性能数据,以便分析并行程序性能成为一个难点,文章介绍
了一种基于迭代聚类的并行应用性能分析方法,该方法使用数据挖掘的聚类算法处理处理海量
性能数据,并可以根据条件迭代执行,确定影响并行程序性能的函数和进程,然后通过贝叶斯
信息准则评价聚类结果,以确定迭代聚类的可靠性,最后用实验证明了方法的有效性。
关键词:海量数据,并行应用,聚类分析,性能测量,性能分析
随着超级计算机的发展,其使用到的核心数达到 第3节为实验分析。第4节总结全文并提出下一步研
数十万,IBM的RoadRunner核心数有122400个,而 究工作。
Cray XT5使用的计算核心更是达到了224162个,而且
运行于其上的应用的复杂性也不断加大,其复杂性 1. 相关研究
和规模使程序的运行效率难以达到预期。因此,开 [1,2,3]
SimPoint是用来查找并行程序合适的模拟
发人员需要对并行应用进行监测,获得丰富的性能数 点,即能够表征程序性能的若干程序段,减少多
据,并做出分析,以便对程序进行优化,提高执行效 次重复对程序进行模拟运行,以分析程序的性能问
率,达到提高程序性能的目的,因此,如何处理海 题。该项目将应用程序的行为表征为一个基本块向
量性能数据成为了一个难点。 量,在基本块向量中的每一维表示某一段代码运行时
数据挖掘试图从海量数据中找出有用的信息, 间的百分比。然后将程序的执行过程沿时间轴分成
并可以对海量数据进行处理和分析,针对并行应用 若干小段,小段之间进行对比,使用k-means算法
性能监测得到的海量性能数据,随着超级计算机的 [4]
进行聚类总结。SimPoint中将程序分成若干基本块
大规模并行程序的应用,只使用人工可视化工作 向量,每一维代表一段代码执行时间比例。在基本
来进行性能分析,变得很不现实。而借助数据挖掘 块向量中的每一维表示某一段代码运行时间的百分
算法,可以减少性能数据的规模、发现性能数据之 比。不过没有从进(线)程角度考虑,即没有考虑并行
间的关系,大大提高性能分析的效率,减少了人工 应用程序的各个进(线)程在执行过程中的差异性。
分析的复杂度。聚类分析是一种探查数据结构的工 [5,6]
TAU中提供了一个用于复杂性能分析的工具
具,聚类分析的核心是聚类,即将对象划分
您可能关注的文档
- 《噪声污染控制技术》说课说课人郭俊刚轻化工工程系.ppt
- 《实用生物信息技术》课程教学大纲-中国农业科学院研究生院.PDF
- 《工程建设类项目电子招投标办事指南)》.-贵安新区.doc
- 《店铺租约》之《续约变更协议》.PDF
- 《电子病历系统功能应用水平分级评价方法及标准》第6级-中国数字医学.PDF
- 《离散数学》课程教学大纲-同济大学精品课程.PDF
- 《科技政策与咨询快报》2018年第5期-中国科学院科技战略咨询研究院.PDF
- 《软件技术基础概论(VB)》教学大纲.doc
- 《运城市工业经济园区产业集群发展.doc
- 《邮电设计技术》2012—2018.doc
- 一种多核系统任务调度算法动态度量方法-计算机应用研究.PDF
- 一种改进的BP算法在压缩机故障诊断中的应用-空压机.PDF
- 一种改进的推广自适应相干累积算法-声学技术.PDF
- 一种数据模型的范畴论建模方法-计算机应用研究.PDF
- 一种新的路径编码机制在移动机器人路径规划中的-中国科技论文在线.PDF
- 一种新的面向领域的鲁棒性文本分析算法-清华大学信息技术研究院语音.PDF
- 一种晶闸管投切的无功补偿电路设计-电气技术.PDF
- 一种结构光三维扫描系统新标定方法-计算机应用与软件.PDF
- 一种通用论坛信息提取方法-ShandongNormalUniversity.PDF
- 一种面向混合属性数据聚类的新算法-控制与决策.PDF
最近下载
- 日立牌SET-FREE AⅢ系列产品提案书20240628.docx VIP
- AquaECO特灵产品技术手册20231212.pdf VIP
- 中考语文成语易错48道选择题(有详细解析).pdf VIP
- 天津钢管集团股份有限公司.pdf VIP
- 海尔物联多联MAX样册2025-4-10.pdf VIP
- 2023年小升初语文专项练习《地名人名拼写规则》(含答案).docx VIP
- 辅警结构化面试题及答案(2025年.docx VIP
- SET-FREE AⅢ产品样册-日立.pdf VIP
- 105656-海尔智慧楼宇检测中心概况(实验室布局,测试能力范围,实验室介绍,数字化测试,实验室认证).docx VIP
- 井控考试试题库(DOC) .pdf VIP
文档评论(0)