计算机行业重大事项点评：阿里巴巴开源Qwen3，登顶全球第一开源模型.docxVIP

下载本文档

18
0
约3.04千字
约 7页
2025-05-10 发布于北京
举报
版权申诉

计算机行业重大事项点评：阿里巴巴开源Qwen3，登顶全球第一开源模型.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

TOC\o1-2\h\z\u一、Qwen3大幅节省算力消耗，应用场景更加丰富 4

（一）支持两种思考模式，大幅节省算力消耗 4

（二）多语言和Agent能力提升，应用场景扩展 4

二、Qwen3刷新SOTA，性能表现卓越 6

三、登顶全球第一开源模型，加速AI应用商业化进程 8

四、投资建议 8

五、风险提示 8

图表目录

图表1 不同基准测试集中非思考模式与思考模式的思考预算变化趋势 4

图表2 Qwen3支持的语言及方言 5

图表3 Qwen3思考并与环境交互 5

图表4 Qwen3系列8款模型详细参数 6

图表5 Qwen3旗舰模型Qwen3-235B-A22B基准测试表现 6

图表6 Qwen3小型MoE模型基准测试表现 7

图表7 Qwen、Llama、Mistral系列开源模型的衍生模型数量随时间的增加情况 8

一、Qwen3大幅节省算力消耗，应用场景更加丰富

（一）支持两种思考模式，大幅节省算力消耗

Qwen3作为国内首个混合推理架构模型，开创性地支持两种差异化认知模式：其一是“深度思考模式”，该模式通过层层递进的逻辑推理路径，对复杂问题进行精细化拆解与多维度分析，最终输出经过严谨验证的精准结论，特别适用于需要深度知识融合与复杂推理的场景需求；其二是“极速响应模式”，能够在毫秒级时间内直接调用高频知识节点，为用户提供超低延迟的即时性回答，满足瞬时决策类任务的高效交互需求。这种双模态智能的深度融合，实现了对算力资源的动态分配优化，在保障高精度推理质量的同时，通过智能切换机制显著提升了整体能耗效率，为复杂认知任务提供了兼具深度与速度的创新性解决方案，从而在大规模应用中实现推理性能与算力成本的双重突破。

n3Blog官网图表1 不同基准测试集中非思考模式与思考模式的思考预算变化趋势

n3Blog官网

资料来源：Qwe（二）多语言和Agent能力提升，应用场景扩展

资料来源：Qwe

Qwen3模型支持119种语言和方言。增强的多语言能力为国际应用开辟了新的可能性，可以让更广泛的全球用户体验到模型的强大能力。

机器之心公众号资料来源：Qwe图表2 Qwen3支持的语

机器之心公众号

资料来源：Qwe

资料来源：Qwen3模型的Agent和代码能力得到增强，包括加强了对MCP的支持，使Agent的适用度和灵活性得到提升，拓宽了模型的应用场景。

资料来源：

n3Blog官网图表3 Qwen3思考并与

n3Blog官网

资料来源：Qwe资料来源：Qwe二、Qwen3刷新SOTA，性能表现卓越

资料来源：Qwe

在性能测试方面，Qwen3的旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等多领域基准测试中表现出色，与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶尖模型相比毫不逊色。特别是在奥数水平的AIME25测评中，Qwen3-235B-A22B以

81.5分的优异成绩刷新了开源纪录；在代码能力LiveCodeBench测评中，该模型成功突破70分大关，力压Grok3；在用于评估模型人类偏好对齐的ArenaHard测评里，Qwen3-235B-A22B凭借95.6分的高分，超越了OpenAI-o1以及DeepSeek-R1。

n3Blog官网图表4Qwen3系列8

n3Blog官网

图表5 Qwen3旗舰模型Qwen3-235B-A22B基准测试表现

n3Blog官网

小型MoE模型表现中，Qwen3-30B-A3B的激活参数数量仅为QwQ-32B的10%，表现却更胜一筹。甚至像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能，在AIME25、LiveCodeBench等基准测试中超越OpenAI-o1及DeepSeek-R1。

n3Blog官网图表6Qwen3小型MoE

n3Blog官网

资料来源：QweQwen3部署成本显著下降。仅需4张H20即可部署满血版模型，是满血版671BDeepSeek-R1的25%～35%，部署成本大降75%～65%

资料来源：Qwe

三、登顶全球第一开源模型，加速AI应用商业化进程

Qwen系列成为全球第一开源模型。阿里通义已开源了200余个模型，全球下载量超3亿次，Qwen衍生模型数超10万个，已超越Llama，成为全球最大的开源模型族群

您可能关注的文档

文档评论（0）

535600147 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：6010104234000003

1亿VIP精品文档

更多 >

计算机行业重大事项点评：阿里巴巴开源Qwen3，登顶全球第一开源模型.docxVIP