- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2010年第三季度高性能计算机系统使用情况报告
2010年第三季度高性能计算机系统使用情况报告
2010年第三季度高性能计算机系统整体运行良好,继续保持了很高的可用率。系统共发生5次硬件故障,主要分布于HPS高性能交换系统、F02n08节点和F02n01节点;系统软件共发生2次故障,分别由生效cron补丁和f02n01节点/usr/bin/mksysb文件异常造成;在用户数量方面,整个第三季度系统无新增用户,用户总量仍为11个;在资源使用方面,仍在较低利用率的情况下保持稳定。
系统可用性情况统计
2010年第三季度IBM高性能计算机系统硬件及存储系统继续保持了很高的可用率。7月份主机节点可用率为99.60%,主要原因是受f02n08节点故障影响,其中包括一次DCA电源模块故障和一次SNI卡故障,DCA电源模块故障导致节点宕机,而SNI卡的更换需要节点停机进行。8月份和9月份各个节点均无停机,因此主机节点可用率均为100%。除此之外,系统整体运行平稳,其余故障的发生和配件更换由于系统高可用性的冗余设计,没有影响整个系统的正常运行,因此,系统可用率为100%,如图1所示:
图1 系统可用率统计
设备运行情况统计
2010年第三季度硬件故障数量分类统计如表1和图2所示:
表1 故障类别和数量统计
维护类别 维修次数 比例 HPS交换机 2 40% F02n08 2 40% F02n01 1 20% 合计 4 100% 本季度共发生5次故障,故障的数量和类型相对比较稳定,均为常见故障。其中HPS高性能交换系统共发生2次故障,占故障总数的40%,均为switch电源故障。F02n08节点共发生2次故障,占故障总数的40%,其中DCA电源模块故障一次,SNI卡故障一次。F02n01节点发生一次硬盘故障,占故障总数的20%。由于在发生故障后值班员及时通知IBM工程师进行相关处理,从而保证了在最短时间内恢复系统的正常运行。
图2 故障类别和数量统计
系统软件运行情况
2010年第三季度共发生两次系统软件故障,第一次故障是由升级IBM技术工程师提供的cron补丁时发生异常造成,该故障导致test用户的crontab定时作业执行失败,系统管理员通过IBM技术支持,修改queuedef文件的进程数后恢复正常。 第二次故障是由f02n01节点的/usr/bin/mksysb文件发生异常造成,该故障导致f02n01节点执行smitty mksysb失败,经系统管理员查明,该文件版本与f01n01节点相同,因此从f01n01节点上拷贝/usr/bin/mksysb文件覆盖 f02n01节点的/usr/bin/mksysb文件后恢复正常。由于两次故障系统管理员发现和处理及时并未影响到系统和业务的运行。
用户情况
2010年第三季度,高性能计算机没有新增账户。截至目前,高性能计算机系统共有业务及科研用户11个,所属单位及用途如表3所示:
表3 高性能计算机系统用户分类统计信息
应用名称 所属单位 用途 运算频次 WRF模式 科研所 业务 每日3次 MM5模式 科研所 业务 每日2次 风暴潮预报业务模式风场数据获取 气象台 业务 每日1次 风能资源的数值模拟 气候中心 业务 每月1次 WRF模式程序调试 科研所 科研 不定期 WRF模式程序调试 科研所 科研 不定期 WRF模式程序调试 科研所 科研 不定期 MM5模式程序调试 科研所 科研 不定期 海洋模式的研究 科研所 科研 不定期 气候业务模式REGCM预研究 气候中心 科研 不定期 海冰模式参数化方案的改进 气象台 科研 不定期 天津地区2009年汛期一次强降雨天气过程分析 业务处 科研 不定期
资源使用情况
计算资源使用情况
总体上来说,每日定时运行的WRF模式、MM5模式、风暴潮预报业务模式风场数据获取程序对计算资源的消耗较为固定。风暴潮预报业务模式风场数据获取程序每次只占用1个CPU将近20分钟左右的时间,对计算资源的占用较少; WRF模式和MM5模式则是占用HPC计算资源的主力。图3是抽取这三类业务模式运行的单日CPU记账记录绘制而成的HPC单日CPU利用率分布情况。图中CPU利用率较高的三个时段即是WRF模式和MM5模式的运行时段,由于下午MM5模式不运行,所以下午CPU占用率高的时长小于上午和夜间。7月上旬由于节点f02n08故障,为确保模式正常运行,WRF模式改为14个节点运行。7月13日,恢复为16个节点运行。由于目前系统处于低负荷运行状态,对系统整体运行状况影响很小。
图3 全部节点可用时CPU利用率分布图
HPC在2010第三季度总体运行良好,图4展示了2010第三季度HPC计算资源的各月消耗情况,计算资源的利用率基本稳定。由于用户wangqy的风暴潮预报业务模式对计算资源的使用集中在
您可能关注的文档
最近下载
- 《成人围手术期血糖监测专家共识》解读【26页】.pptx VIP
- 八上物理:【教科】期末模拟卷【八上全册】.docx VIP
- 水文学与水文地质学答案.doc VIP
- 中国建设银行建银工程咨询有限责任公司2026年度校园招聘9人笔试备考试题及答案解析.docx VIP
- 学生英语单词听写稿纸模板(仅打印).docx VIP
- 2025年电力调度题库及答案.doc
- (正式版)DB61∕T 1770-2023 《公路隧道二次衬砌施工质量控制指南》.docx VIP
- 《宁波市海绵城市建设技术标准图集》2018甬DX-09.pdf
- 中国建设银行建银工程咨询有限责任公司2026年度校园招聘9人笔试参考题库附答案解析.docx VIP
- 《建设工程工程量清单计价规范》GB505002013.pdf
原创力文档


文档评论(0)