CN119597368A 一种大模型集群的资源配置方法、装置、设备、存储介质及程序产品 (星环信息科技(上海)股份有限公司).docxVIP

  • 2
  • 0
  • 约2.56万字
  • 约 34页
  • 2026-05-22 发布于山西
  • 举报

CN119597368A 一种大模型集群的资源配置方法、装置、设备、存储介质及程序产品 (星环信息科技(上海)股份有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119597368A

(43)申请公布日2025.03.11

(21)申请号202411703999.6

(22)申请日2024.11.26

(71)申请人星环信息科技(上海)股份有限公司

地址200233上海市徐汇区虹漕路88号3

楼、B栋11楼

(72)发明人杨一帆李航正洋唐剑飞

(74)专利代理机构北京品源专利代理有限公司11332

专利代理师初春

(51)Int.Cl.

G06F9/445(2018.01)

G06N3/0455(2023.01)

G06N3/08(2023.01)

权利要求书3页说明书13页附图3页

(54)发明名称

一种大模型集群的资源配置方法、装置、设

备、存储介质及程序产品

(57)摘要

CN119597368A本发明公开了一种大模型集群的资源配置方法、装置、设备、存储介质及程序产品。包括:基于用户选择的配置任务确定配置参数;基于所述配置任务及所述配置参数确定算力需求、带宽需求及显存需求中的至少一种;根据所述算力需求、带宽需求及显存需求中的至少一种构造约束条件及目标函数;基于所述约束条件利用预设的规划算法对目标函数进行迭代优化,以求解所述未知配置参数,获得目标配置参数。本发明实施例提供的大模型集群的资源配置方法,可以确定出

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档