Deepseek为开源领域贡献价值不亚于llama
1、deepseek的创新有哪些?
2、deepseek带来的影响有哪些?
3、deepseek、mistral-small、qwen2.5-max哪个好?
4、畅想2025
占冰强AIGCLINK2025.02
deepseek创新有哪些?
?数据集准备创新:初步实现小部分依赖人类数据,大部分依赖机器强化学习
?模型训练架构创新:MLA+MOE+MTP
?算力调配系统创新:并行训练框架HAI-LLM,负载均衡优化实现moe训练gpu利用率低的问题,通信优化,内存优化,计算优化(FP8)
您可能关注的文档
最近下载
- 第28-34YMO全国总评选试卷(二年级).doc VIP
- 天津市河西区名校2023-2024学年中考数学模拟试题含解析.doc VIP
- 中级会计实务-07.第六章 长期股权投资和合营安排.doc VIP
- 中级会计2025讲义 会计实务06.第六章 长期股权投资和合营安排.doc VIP
- 天津市中考数学模拟试卷及答案 (6).docx VIP
- 2025年天津市中考数学模拟试卷试题及答案详解.docx VIP
- 《传播学概论》全书笔记.pdf VIP
- 2026年天津市中考模拟语试卷试题及答案详解 .pdf VIP
- 2025-2026年山东省临沂市平邑县六年级上学期期末数学检测试卷(人教版)含答案.pdf VIP
- 二年级语文无纸笔测评题库.pdf VIP
原创力文档

文档评论(0)