- 2
- 0
- 约1.69万字
- 约 24页
- 2026-06-04 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119645609A
(43)申请公布日2025.03.18
(21)申请号202411854410.2
(22)申请日2024.12.17
(71)申请人天津大学
地址300072天津市南开区卫津路92号
(72)发明人汤志航赵来平
(74)专利代理机构北京保识知识产权代理事务所(普通合伙)11874
专利代理师张立荣
(51)Int.Cl.
G06F9/48(2006.01)
G06F9/54(2006.01)
G06F9/50(2006.01)
权利要求书2页说明书8页附图4页
(54)发明名称
基于时空二维分割与智能共享的大模型并
行任务调度方法
(57)摘要
CN119645609A本发明公开了基于时空二维分割与智能共享的大模型并行任务调度方法,具体提出了一种基于时空二维的模型分割策略,基于训练和推理两类任务在计算性质上的显著差异,分别采用了针对性的优化策略,提高了任务执行效率;还提出了一种基于异构资源和干扰模型的模型放置策略,解决传统方法缺乏智能共享判断,无法动态调整的缺点,提高了调度的灵活性和适应性,从而保证共享资源的最大收益。本发明解决了现有异构智算集群的调度方法在处理大模型训练和推理任务时,未能充分利用模型分割和异构资源适配的模型放置优化
您可能关注的文档
- CN119645343A 基于音源参数的音频数据混合方法及系统 (广州昶视电子科技股份有限公司).docx
- CN119645354A 应用全生命周期管理系统、方法、装置及存储介质 (北京亚控科技发展有限公司).docx
- CN119645358A 多人协同编程的方法、系统、电子设备及介质 (苏州格拉尼视觉科技有限公司).docx
- CN119645377A 微服务架构用组态软件开发的图形化构建和边缘部署方法 (北京东方通科技股份有限公司).docx
- CN119645407A 一种数据处理方法及相关装置 (腾讯科技(深圳)有限公司).docx
- CN119645428A 用于模型优化的方法及计算设备 (深圳鲲云信息科技有限公司).docx
- CN119645429A 一种基于大模型的智能调解助手构建方法与系统 (广州金融科技股份有限公司).docx
- CN119645455A 硬件配置更新方法、装置及电子设备 (联想(北京)有限公司).docx
- CN119645472A 一种基于zynq的在线升级方法及装置 (杭州爱华仪器有限公司).docx
- CN119645475A 降低执行代码覆盖率分析的服务器的负载的方法和系统 (领悦数字信息技术有限公司南京分公司).docx
原创力文档

文档评论(0)