开源模型运动周报:Llama、Mistral与国内开源生态最新动态.pptxVIP

  • 3
  • 0
  • 约3.03千字
  • 约 15页
  • 2026-06-26 发布于北京
  • 举报

开源模型运动周报:Llama、Mistral与国内开源生态最新动态.pptx

2026/06开源模型运动周报Moeimijiang

目录核心开源基座模型动态社区微调与工具生态GitHub星数增长与趋势洞察010203

核心开源基座模型动态01

Llama4生态:开源效应持续放大专家蒸馏尝试社区开始大量尝试对Scout进行专家蒸馏MOE专家裁剪重组对16个MOE专家模块进行裁剪和重组推理体积压缩保留约80%性能的前提下将推理体积压缩至原先的1/4消费级硬件部署有利于在消费级硬件上部署12,000+HuggingFace模型数↑持续快速增长85,000GitHub累计Stars1,800本周新增

MistralLarge2:欧洲开源旗舰升级123B参数规模密集模型1258LMSYSElo得分第一梯队94.2%HumanEval得分超越GPT-4o性能表现LMSYSChatbotArena综合Elo得分约1258与Claude3.5Sonnet和GPT-4o处于同一梯队关键更新点代码生成在HumanEval上得分达到94.2%,首次超越GPT-4o(93.8%)新增函数调用原生支持,降低企业集成开发量上下文窗口维持128K,长文本利用率在中后段明显改善许可模式使用MistralResearchLicense,允许研究和非商业使用,商业部署需获得Mistral单独授权

DeepSeek-V3:开源周后的生态爆发开源周活动2025年5月底,De

文档评论(0)

1亿VIP精品文档

相关文档