2025年9月中文大模型基准测评报告：国内外模型进展与对比分析.pptxVIP

下载本文档

2
0
约1.25万字
约 25页
2026-06-04 发布于北京
举报

2025年9月中文大模型基准测评报告：国内外模型进展与对比分析.pptx

中文大模型基准测评2025年9月报告——2025年中文大模型阶段性进展9月评估SuperCLUE团队2025.10.16

精准量化通用人工智能（AGI）进展，定义人类迈向AGI的路线图AccuratelyQuantifyingtheProgressofAGI,DefiningtheRoadmapforHumanitysJourneytowardsAGI.

报告摘要1.海外模型保持头部优势，国内模型继续追赶。在本次9月通用测评中，海外模型占据了榜单前6，其中GPT-5(high)以69.37分遥遥领先，o4-mini(high)（65.91分）、Claude-Sonnet-4.5-Reasoning（65.62分）、Claude-Opus-4.1-Reasoning（64.87分）、Gemini-2.5-Pro（64.68分）等紧随其后。国内的DeepSeek-V3.2-Exp-Thinking、Doubao-Seed-1.6-thinking-250715分别以62.62分和60.96分并列国内第一。01九月测评三大要点2.国内开源模型优势显著。02国内的DeepSeek-V3.2-Exp-Thinking（62.62分）、openPangu-Ultra-MoE-718B（58.87分）和Qwen3-235B-A22B-Thinking-2507（57

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2025年9月中文大模型基准测评报告：国内外模型进展与对比分析.pptxVIP