网络与高性能计算团队_开源集群平台性能监控授课计划.pdfVIP

  • 2
  • 0
  • 约2.62千字
  • 约 4页
  • 2018-03-31 发布于河南
  • 举报

网络与高性能计算团队_开源集群平台性能监控授课计划.pdf

网络与高性能计算团队_开源集群平台性能监控授课计划

开源集群平台性能监控授课计划 指导教师:刘涛、赵冬梅 学生助教:蔺涛涛、李孟伟 1. 课程目的 此次课程主要结合学院网络与高性能计算的科研方向,试图让学生了解集 群的基本概念、集群的组织方式、影响集群性能的关键因素;而切入点从开源 集群的性能和网络通信监控入手,试图通过完成一个C 语言和shell 语言相结 合的脚本程序,实现对集群计算性能和网络通信的监控,从而实现对上述集群 概念的了解;而使用C 语言和脚本语言完成此监控程序的过程,正是学生学 习、掌握和运用程序语言完成具体设计任务的过程,真实的设计任务更能够加 深对语言语法、使用技巧等方面的了解,达到通过具体设计完成程序语言学习 的目的。 2. 课程方式 本课程试图改变传统实验课的上课模式,通过将教学过程融入到具体任务 及其实现过程之中, 是一次教学与实际密切结合的课程改革尝试,需要将课程 知识点及程序语言要点与实际设计流程及实现要点联系起来理解和学习,需要 学习如何将已有程序语言运用于设计需求分析、程序模块确定、程序设计及调 试的过程。课程学习强调工程实践性及其与理论的良好结合,因此,课程上课 方式也从传统的讲授方式向小组讨论、个人演示等方式进行转变。 3. 考核方式 在基本掌握C 语言语法的基础之上,通过对集群的性能影响因素进行分 析,通过此课程的训练,应能基本独立类似监控程序的设计方案。并且要求能 够运用所学问题分析和流程设计等知识,独立完成简单C 语言及脚本语言的设 计,同时能将任务分析方法结合于程序设计、脚本编写中,培养学生独立进行 成形需求分析、制定问题逻辑解决方案并独立设计网络程序的能力。最后,提 交考核和评定成绩主要需要提供符合项目设计规范的需求分析文档、详细设计 文档和最后良好运行的程序代码。 周一 周二 周三 周四 周五 周六 am 项目和课程总 脚本语言 集群任务 网络监控 测试数据 体介绍(刘涛) 编写(刘 运行(刘 C 语言+ 命令(刘 获取 涛) 涛) 脚本程序 涛) (刘涛) 编写的程 pm 环境熟悉 (李 C 语言结 运行监控 序监控 完善的 文档编写 孟伟、赵冬梅) 合shell 命令(蔺 (蔺涛涛) C脚本 课程总结 (刘涛) 涛涛、赵 (李孟伟) (李孟伟、 (刘涛、蔺 赵冬梅) 涛涛、赵冬 冬梅) 梅) 4.附 什么是集群: 集群技术可如下定义:一组相互独立的计算机在网络中表现为单一的系 统,并以单一系统的模式加以管理。此单一系统提供高性能的计算服务。集群 内各节点计算机通过一内部局域网相互通讯。当一台节点计算机发生故障时, 这台计算机上所运行的应用程序将在另一节点计算机上被自动接管。当一个应 用服务发生故障时,应用服务将被重新启动或被另一节点接管。当以上的任一 故障发生时,客户都将能很快连接到新的应用服务上 参考资料:/u2/76263/showart_1664446.html 集群的构建分为以下几个步骤: 硬件的检测;安装和配置操作系统;安装和配置安全连接通道-SSH;安装 和配置多进程通信接口-MPI;测试集群。硬件的检测与安装和配置操作系统, 可能觉得毫无悬念,特别是对于熟悉linux 的人来说,更是这样。可能最关心 的是后边3 个步骤。但是对于一个拥有大量节点的集群来说,集群安装和配置 的自动化,集群日常运行的自动

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档