- 0
- 0
- 约9.62千字
- 约 39页
- 2026-03-26 发布于浙江
- 举报
如何提升大模型任务能力张奇复旦大学1
如何提升大模型任务能力
张奇
复旦大学
1
数据集合算法模型资源需求2强化学习用户指令十万用户指令强化学习方法RL模型1-100GPU天级别训练时间ChatGPT、Claude
数据集合
算法
模型
资源需求
2
强化学习
用户指令
十万用户指令
强化学习方法RL模型
1-100GPU
天级别训练时间
ChatGPT、Claude
奖励函数
标注对比对
百万标注对比对
二分类模型
RM模型
1-100GPU
天级别训练时间
指令微调
标注用户指令
百万用户指令和对应的答案
语言模型预训练
SFT模型
1-100GPU
天级别训练时间
MOSS、
您可能关注的文档
最近下载
- 离散数学答案(刘玉珍_编着).doc VIP
- 幼儿园课程游戏化和五大领域有机结合的策略优秀获奖科研论文.pdf VIP
- 给排水国标图集-04S531-5:湿陷性黄土地区排水检查井.pdf VIP
- 幼儿园课程游戏化和区域活动结合的途径.docx VIP
- 三坐标初级试题及答案.docx VIP
- ZL-803A控制器使用说明V1.0.pdf VIP
- 2026年-IEC 60287-1-1-2023 电缆-载流量计算-第1-1部分:载流量公式(100% 负载率)和损耗计算-总则-新版.docx
- 浅谈幼儿园课程游戏化实现途径和实 论文.docx VIP
- 2025年研究生408统考真题及答案(含综合题详细解析).pdf VIP
- 《工程机械设计》第5章-履带式工程机械行走系.ppt VIP
原创力文档

文档评论(0)