- 0
- 0
- 约4.93万字
- 约 80页
- 2026-03-19 发布于浙江
- 举报
DeepSeek-R1\Kimi1.5及
类强推理模型开发解读
陈博远
北京大学2022级“通班”
主要研究方向:大语言模型对齐与可扩展监督
https://cby-pku.github.io/
/
北大对齐小组
Outline2
➢DeepSeek-R1开创RL加持下强推理慢思考范式新边界
➢DeepSeek-R1Zero及R1技术剖析
➢Pipeline总览\DeepSeek-V3Base\DeepSeek-R1Zero及R1细节分析
➢RL算法的创新:GRPO及其技术细节
➢DeepSeek-R1背后的InsightsTakeaways:RL加持下的长度泛化\推理范式的涌现
您可能关注的文档
- 2025人工智能自主宣言.pdf
- 2025市场趋势与薪资报告-CONNECTUS.pdf
- 2025天猫国际跨境酒白皮书-天猫国际x智篆GI.pdf
- 2025我们该如何看待DeepSeek——what, how, why, and next-湖南大学.pdf
- 2025医美水光针行业简析报告-嘉世咨询.pdf
- 2025中国女性职场现状调查报告-智联研究院.pdf
- 2025中国新手妈妈现状调查报告——看见母亲的困境与希望-珀莱雅公益.pdf
- AI Checklist QUNAR测试域结合AIGC提效实践AIDD.pdf
- AIDC系列(四):柴发机组——供需错配下的高景气赛道-民生证券.pdf
- AIGC如何助力工作和学习-清华大学.pdf
最近下载
- 2025最新湖北国企试试题及答案.docx VIP
- 2026年沈阳职业技术学院单招职业倾向性考试题库及参考答案详解.docx VIP
- 南方新课堂·金牌学案 数学八年级下册 配北师大版(课件)第1课 不等式及其基本性质(1).pptx
- 触摸感应芯片vk36n16i 规格书v2.pdf VIP
- 高频精选:驾驶员岗位面试题及答案.doc VIP
- 第五章_粉碎_筛析_混合.ppt VIP
- 简易专用半自动三轴钻床传动装置设计.doc VIP
- 高教社2026宴会设计与管理教学课件项目八.pptx VIP
- T_CACM 1355-2021 中医穴位贴敷基层临床应用技术操作规范.docx VIP
- (2025)网格员考试题库(满分必刷)(含答案).docx VIP
原创力文档

文档评论(0)