- 0
- 0
- 约2.26万字
- 约 32页
- 2026-05-11 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119539023A
(43)申请公布日2025.02.28
(21)申请号202510026455.9
(22)申请日2025.01.08
(71)申请人杭州海康威视数字技术股份有限公司
地址310051浙江省杭州市滨江区阡陌路
555号
(72)发明人沈力行
(74)专利代理机构深圳市世纪恒程知识产权代理事务所44287
专利代理师罗铭
(51)Int.Cl.
G06N3/092(2023.01)
G06N3/0464(2023.01)
G06N3/0442(2023.01)
G06N3/045(2023.01)
G06F18/214(2023.01)
权利要求书2页说明书12页附图4页
(54)发明名称
大语言模型训练方法、装置、计算机设备、介
质和产品
(57)摘要
CN119539023A本申请实施例提供一种大语言模型训练方法、装置、计算机设备、介质和产品,涉及模型训练技术领域。该方法先通过文本数据对初始MOE模型进行预训练,得到MOE预训练模型,然后通过第二训练集对MOE预训练模型进行多任务训练,使得训练得到MOE对话模型可以根据输入数据生成与输入数据相关的输出结果,从而完成各种不同的任务。最后,对MOE对话模型进行用户偏好引导,得到MOE奖励
您可能关注的文档
- CN119538708A 一种基于KAN网络的Ia型超新星光谱参数快速反演方法 (三峡大学).docx
- CN119538739A 考虑燃料电池输出功率下降的dqn能量管理策略优化方法 (北京交通大学).docx
- CN119538743A 一种预测电池soh和rul的模型训练方法、预测方法及设备 (南通乐创新能源有限公司).docx
- CN119538747A 一种基于伴随神经网络的微波器件大范围建模方法及系统 (北京邮电大学).docx
- CN119538748A 一种基于稀疏网格空间映射的光学器件建模方法及装置 (北京邮电大学).docx
- CN119538752A 一种基于wso-elm网络模型的冰期流速预测方法 (南京微麦科斯电子科技有限责任公司).docx
- CN119538753A 电池组智能配对与集成优化方法、系统、设备及存储介质 (珠海市嘉德电能科技有限公司).docx
- CN119538753B 电池组智能配对与集成优化方法、系统、设备及存储介质 (珠海市嘉德电能科技有限公司).docx
- CN119538754A 一种融合物理信息的三向地应力智能预测方法 (西南石油大学).docx
- CN119538755A 一种海上落水人员漂流轨迹预测方法 (福建理工大学).docx
- 2026年经济师初级经济基础真题及答案.docx
- 跨境电商供应链管理(AIGC版)课件全套 许四化 项目1--8 跨境电商供应链管理概述 ---- 跨境电商供应链风险管理.pptx
- QB 1318-1991探测器盒纸板专题研究报告.pptx
- QB 2483-2000食品添加剂 天然维生素E专题研究报告.pptx
- NYT 4743-2025《蜂蜜中花粉相对含量的测定》专题研究报告.pptx
- 脑钠肽与心力衰竭严重程度关系.pptx
- QBT 1274-2012毛皮化学试验总灰分测定专题研究报告.pptx
- 血小板抗体检测与输血相关性紫癜.pptx
- QBT 1555-2001地毯毯基上绒头厚度的试验方法专题研究报告.pptx
- QBT 2212.13-1996《建筑工具(泥瓦类) 菱形砌铲》专题研究报告.pptx
最近下载
- 2025年高考真题黑、吉、辽、蒙生物真题.pdf VIP
- 山东省实验中学2025_2026学年第二学期期中高一生物试题(文字版,含答案).docx
- 《积极心理学(完整版)》.doc VIP
- 食品生物工程导论课件.pptx VIP
- +疱疹病毒..ppt VIP
- 标准图集-15J403-1 楼梯 栏杆 栏板(一).pdf VIP
- (2026版)贪污贿赂司法解释(二)培训PPT课件.pptx VIP
- 安师联盟2026年中考权威预测模拟卷(三)道法(含答案).pdf VIP
- 21起典型火灾案例及消防安全知识专题培训课件(2025年).ppt
- 眼屈光检查 双眼视觉分析法准则的应用 8.3双眼视异常分析---法则的应用 2020.pptx
原创力文档

文档评论(0)