2025年9月中文大模型基准测评报告:国内外模型进展与对比分析.pptxVIP

  • 2
  • 0
  • 约1.25万字
  • 约 25页
  • 2026-06-04 发布于北京
  • 举报

2025年9月中文大模型基准测评报告:国内外模型进展与对比分析.pptx

中文大模型基准测评2025年9月报告——2025年中文大模型阶段性进展9月评估SuperCLUE团队2025.10.16

精准量化通用人工智能(AGI)进展,定义人类迈向AGI的路线图AccuratelyQuantifyingtheProgressofAGI,DefiningtheRoadmapforHumanitysJourneytowardsAGI.

报告摘要1.海外模型保持头部优势,国内模型继续追赶。在本次9月通用测评中,海外模型占据了榜单前6,其中GPT-5(high)以69.37分遥遥领先,o4-mini(high)(65.91分)、Claude-Sonnet-4.5-Reasoning(65.62分)、Claude-Opus-4.1-Reasoning(64.87分)、Gemini-2.5-Pro(64.68分)等紧随其后。国内的DeepSeek-V3.2-Exp-Thinking、Doubao-Seed-1.6-thinking-250715分别以62.62分和60.96分并列国内第一。01九月测评三大要点2.国内开源模型优势显著。02国内的DeepSeek-V3.2-Exp-Thinking(62.62分)、openPangu-Ultra-MoE-718B(58.87分)和Qwen3-235B-A22B-Thinking-2507(57

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档