2026高性能计算工程师岗位说明书.docVIP

  • 1
  • 0
  • 约2.25千字
  • 约 2页
  • 2026-05-08 发布于广东
  • 举报

高性能计算工程师岗位说明书(2026年)

岗位名称

高性能计算(HPC)工程师

岗位编号

所在部门

计算平台部/基础设施部/AI平台部

岗位定员

直接上级

职系

直接下级

所辖人员数量

岗位分析

岗位分析日期

岗位概述:

负责公司大规模高性能计算集群与AI训练平台的整体规划、设计、建设、优化与运维。核心目标是构建高吞吐、低延迟、高可扩展性、高能效的计算基础设施,为科学计算、工程仿真、尤其是大规模人工智能模型的训练与推理提供世界级的算力支持。工作涵盖从硬件选型、系统架构、并行环境部署、到应用性能调优与成本优化的全生命周期。

主要工作职责:

1.HPC/AI集群架构设计与规划:根据科研与业务需求,设计并规划下一代高性能计算集群与AI训练平台的总体架构。主导计算节点、加速卡(GPU/TPU)、高速互联网络(InfiniBand/RoCE)、并行文件系统、集群管理软件的选型与技术方案制定,在性能、成本、功耗与可扩展性之间取得最佳平衡;

2.大规模集群部署、运维与自动化:负责大规模集群的自动化部署、日常监控、故障诊断与性能分析。构建并维护资源调度、作业管理、系统监控、自动化运维平台,保障集群7x24小时高可用性。制定并执行容灾备份与安全策略;

3.并行计算环境与性能极致优化:为科研与工程应用部署和优化各类编译器、数学库、MPI/OpenMP等并行编程环境、容器与调度器。深度分析与调优关键计

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档