长期模型优先，看好coding商业化价值.pptxVIP

下载本文档

1
0
约2.03万字
约 10页
2026-06-03 发布于北京
举报

长期模型优先，看好coding商业化价值.pptx

核心观点

LLM技术发展从预训练架构创新向后训练和推理驱动演绎。我们复盘LLM(LargeLanguageModel)的技术路径发展，2025年以前模型厂商通过堆算力、数据，做大模型参数，从而发挥预训练scalinglaw，打造底模的智能基础，以此锁定继续在AI牌桌上角逐的入场券，即我们认为预训练是大模型竞赛的首要核心壁垒。2025年后以DeepSeekR1为代表的推理模型，发挥RL阶段ScalingLaw，使其成为提升大模型能力的核心手段。展望26年，LLM主流架构基本确定，但行业仍在探索更高效架构，最大化利用算力提升建模效率的路径；此外模型性能改进的核心动能转向后训练和推理阶段，包括RLVR向其他领域拓展、以及推理时的inference-timescaling等，后者仍对计算资源有较高要求。

行业CapEX高投入趋势确定，投入领先的厂商更有可能拉开技术代差。从25~28年CapEX投入量级的3年CAGR增速看，基数和增速均较快的包括OpenAI(147%)/Anthropic(96%)/谷歌(39%)/Meta(35%)。模型厂商的投入量级有所分化，如海外互联网厂商谷歌和Meta的CapEX投入量级在千亿美元以上，国内互联网厂商(阿里、腾讯、字节)和海外AI模型大厂(OpenAI、Anthropic)投入量级在百亿美元，国内AI模型独立厂商智谱和

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

长期模型优先，看好coding商业化价值.pptxVIP