- 0
- 0
- 约3.73万字
- 约 51页
- 2026-01-14 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN120068846B(45)授权公告日2025.07.01
(21)申请号202510526403.8
(22)申请日2025.04.25
(65)同一申请的已公布的文献号申请公布号CN120068846A
(43)申请公布日2025.05.30
(73)专利权人山东海量信息技术研究院
地址250000山东省济南市高新技术开发
区国家信息通信国际创新园
(72)发明人沈艳梅宿栋栋刘伟
(74)专利代理机构北京集佳知识产权代理有限公司11227
专利代理师张志梅
(51)Int.CI.
GO6F40/216(2020.01)
GO6F9/50(2006.01)
GO6N5/04(2023.01)
(56)对比文件
CN117194056A,2023.12.08
CN119150994A,2024.12.17
审查员隗仁然
权利要求书4页说明书18页附图6页
(54)发明名称
语言任务处理方法、系统、设备、存储介质及
程序产品
(57)摘要
CN120068846B本发明公开了一种语言任务处理方法、系统、设备、存储介质及程序产品,涉及人工智能技术领域。其中,方法包括根据语言任务处理模型在执行语言任务过程中的资源需求信息确定其在预填充阶段和解码阶段的资源配置信息。从当前请求批请求中获取相匹配数量的目标请求段,对其进行预填充并行处理生成当前词元批。通过获取最新生成的词元批中各词元的下一个词元构成新的词元批的方式,生成多个新词元批,以满足合并批至词元批长度的条件。通过多个流水线并行对各词元批进行解码,并根据各任务处理请求的所有请求段的解码结果得到对应的语言任务处理结果。本发明可以解决相关技术在执行
CN120068846B
根据语言任务处理模型在执行语言任务过程中的
根据语言任务处理模型在执行语言任务过程中的资源需求信息,确定语言任务处理模型分别在预
填充阶段和解码阶段的资源配置信息,并根据预
填充资源配置信息和解码资源配置信息确定词元
批长度
从当前请求批的各任务处理请求中,获取与预填充资源配置信息相匹配个数的目标请求段,对各目标请求段并行进行预填充处理,生成当前词元批;在当前请求批中,通过获取当前时刻最新生
成的词元批中各词元的下一个词元,并将各下一ys202
个词元构成新的词元批的方式,生成多个新词元
批,以满足合并当前词元批和各新词元批的长度
达到词元批长度的条件
利用解码资源配置信息构建多个流水线,通过多
个流水线并行对各当前令牌批进行解码处理,并
根据各任务处理请求的所有请求段的解码结果得
到对应的语言任务处理结果
S203
S201
CN120068846B权利要求书1/4页
2
1.一种语言任务处理方法,其特征在于,包括:
根据语言任务处理模型在执行语言任务过程中的资源需求信息,确定所述语言任务处理模型分别在预填充阶段和解码阶段的资源配置信息,并根据预填充资源配置信息和解码资源配置信息确定词元批长度;
从当前请求批的各任务处理请求中,获取与预填充资源配置信息相匹配个数的目标请求段,对各目标请求段并行进行预填充处理,生成当前词元批;在所述当前请求批中,通过获取当前时刻最新生成的词元批中各词元的下一个词元,并将各下一个词元构成新的词元批的方式,生成多个新词元批,以满足合并所述当前词元批和各新词元批的长度达到所述词元批长度的条件;各目标请求段的长度相同,且为对应任务处理请求的部分内容;
利用解码资源配置信息构建多个流水线,通过多个流水线并行对各词元批进行解码处理,并根据各任务处理请求的所有请求段的解码结果得到对应的语言任务处理结果。
2.根据权利要求1所述的语言任务处理方法,其特征在于,根据语言任务处理模型在执行语言任务过程中的资源需求信息,确定所述语言任务处理模型分别在预填充阶段和解码阶段的资源配置信息,包括:
当所述语言任务处理模型的双倍内存占用需求量、激活内存占用量及最大生成长度对应的键值缓存的内存占用需求量之和,大于等于单个主机节点具有的内存资源总量,则使用不同主机节点处理所述预填充阶段和所述解码阶段;
当所述语言任务处理模型的双倍内存占用需求量、激活内存占用量及最大生成长度对应的键值缓存的内存占用需求量之和,小于单个主机节点具有的内存资源总量,则所述语言任务处理模型运
您可能关注的文档
- (正式版)DB3310∕T 28-2015 《少核本地早柑橘种植技术规程 》.pdf
- (正式版)DB3310∕T 29-2015 《中学教学活动安全服务规范》.pdf
- (正式版)DB3310∕T 30-2015 《地陪导游员服务规范 》.pdf
- (正式版)DB3310∕T 31-2015 《家电售后服务规范》.pdf
- (正式版)DB3310∕T 32-2015 《酒店会议服务规范》.pdf
- (正式版)DB3310∕T 33-2015 《汽车客运站服务规范》.pdf
- (正式版)DB3310∕T 34-2015 《家装工程服务规范》.pdf
- (正式版)DB3310∕T 35-2016 《连锁便利店服务规范 》.pdf
- (正式版)DB3310∕T 36-2016 《农资销售服务规范 》.pdf
- (正式版)DB3310∕T 37-2017 《城市燃气供应服务规范》.pdf
- CN120068973B 多模态识别模型训练方法、多模态数据识别方法及相关设备 (鹏城实验室).docx
- CN120069501B 一种分布式大数据实时流处理方法及系统 (北京数洋智慧科技有限公司).docx
- CN120069614B 一种基于大数据的国土空间规划管理系统及方法 (山东财经大学).docx
- CN120069618B 流域水工程体系调度风险反向溯源诊断与调控方法及系统 (河海大学).docx
- CN120071163B 基于遥感测绘影像的地形识别与三维重构方法 (山东省地质科学研究院).docx
- CN120071304B 一种基于边界强化的海上环境自适应感知方法及系统 (山东科技大学).docx
- CN120074958B 一种网络安全威胁信息监控管理系统及方法 (江苏省科技资源统筹服务中心).docx
- CN120085026B 一种用于临近空间探测的全静态干涉测风仪及矢量风场反演方法 (南京信息工程大学).docx
- CN120085114B 一种输电线故障融合测距方法及装置 (洛阳龙羽电气设备有限公司).docx
- CN120087559B 基于图谱分析的供应链资源优化方法及系统 (深圳市携客互联科技有限公司).docx
最近下载
- 2024年江苏中职职教高考文化统考语文试卷真题(含答案详解).docx VIP
- 2025最新高中物理必修1第一章《运动的描述》单元测试卷.docx VIP
- 推进教育、科技、人才一体化发行动计划.docx
- 24J306国家建筑标准设计图集.docx
- 沟通的力量:护理人文案例集锦.pptx VIP
- 2023-2024学年安徽省宣城市七年级(上)期末语文试卷(含详细答案解析).docx VIP
- 护理人文关怀实践案例与反思.docx VIP
- 《大学物理》2024-2025学年第一学期期末试卷及答案.docx VIP
- 橡胶和塑料制品加工系统粉尘防爆安全规范.docx VIP
- AQ_4232-2013 塑料生产系统粉尘防爆规范.pdf VIP
原创力文档

文档评论(0)