CN119718554A 一种在k8s上使用异构GPU实现分布式训练的部署方法 (麒麟软件有限公司).docxVIP

  • 5
  • 0
  • 约1.05万字
  • 约 18页
  • 2026-06-14 发布于山西
  • 举报

CN119718554A 一种在k8s上使用异构GPU实现分布式训练的部署方法 (麒麟软件有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119718554A

(43)申请公布日2025.03.28

(21)申请号202510227978.X

(22)申请日2025.02.28

(71)申请人麒麟软件有限公司

地址300450天津市滨海新区塘沽海洋科

技园信安创业广场3号楼6-8层

(72)发明人魏辉洲汪黎钟生平曹远志彭路

(74)专利代理机构北京汇智英财专利代理有限

公司11301

专利代理师陈翠然

(51)Int.Cl.

G06F9/455(2018.01)

G06F9/50(2006.01)

权利要求书2页说明书6页附图2页

(54)发明名称

一种在k8s上使用异构GPU实现分布式训练

的部署方法

(57)摘要

CN119718554A本发明涉及计算机领域,提供一种在k8s上使用异构GPU实现分布式训练的部署方法,包括:编写分布式训练任务清单文件CR1并提交到k8s;控制器一监听CR1的创建,根据CR1的配置创建若干个CR2并为各CR2分配训练任务参数;控制器二监听各CR2的创建,根据各CR2的配置创建若干个Pod并为各Pod分配训练任务参数;控制器二判断当前分布式训练是否为弹性训练,如果是,为每个CR2创建一个Hpa资源;当前分布式训练完成后,控制器一删除当前分布式训练任务的

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档