- 1
- 0
- 约2.03万字
- 约 10页
- 2026-06-03 发布于北京
- 举报
核心观点
LLM技术发展从预训练架构创新向后训练和推理驱动演绎。我们复盘LLM(LargeLanguageModel)的技术路径发展,2025年以前模型厂商通过堆算力、数据,做大模型参数,从而发挥预训练scalinglaw,打造底模的智能基础,以此锁定继续在AI牌桌上角逐的入场券,即我们认为预训练是大模型竞赛的首要核心壁垒。2025年后以DeepSeekR1为代表的推理模型,发挥RL阶段ScalingLaw,使其成为提升大模型能力的核心手段。展望26年,LLM主流架构基本确定,但行业仍在探索更高效架构,最大化利用算力提升建模效率的路径;此外模型性能改进的核心动能转向后训练和推理阶段,包括RLVR向其他领域拓展、以及推理时的inference-timescaling等,后者仍对计算资源有较高要求。
行业CapEX高投入趋势确定,投入领先的厂商更有可能拉开技术代差。从25~28年CapEX投入量级的3年CAGR增速看,基数和增速均较快的包括OpenAI(147%)/Anthropic(96%)/谷歌(39%)/Meta(35%)。模型厂商的投入量级有所分化,如海外互联网厂商谷歌和Meta的CapEX投入量级在千亿美元以上,国内互联网厂商(阿里、腾讯、字节)和海外AI模型大厂(OpenAI、Anthropic)投入量级在百亿美元,国内AI模型独立厂商智谱和
您可能关注的文档
- 2026年某城市玛雅海滩水公园舞台及演艺节”扑腾假日“活动方案.docx
- 部分案件民事起诉状、答辩状示范文本(试行).docx
- 2024年全球电商平台市场年度回顾报告.pptx
- 2026红色报告:十大高频MITRE ATT.pptx
- 2026年某城市玛雅海滩水公园舞台及演艺节”扑腾假日“活动方案.pptx
- 部分案件民事起诉状、答辩状示范文本(试行).pptx
- 2024年全球电商平台市场年度回顾报告.docx
- 2026年全球医疗行业威胁态势报告.pptx
- 2026农业领域农民专业合作社税收优惠政策汇编.pptx
- 2026汽车开发新思考软件定义时代的虚拟化技术白皮书.pptx
- 真正的AI繁荣已至,拥抱全新周期.pptx
- 自驾游助力中国品牌提升“女人缘”.pptx
- 2025AI智能体:企业网络安全新型攻击面调查报告.docx
- 2025墨西哥市场趋势洞察报告.docx
- 2025年AI融合另类数据带来的新机遇与挑战调研报告.docx
- 2025年电子商务基准报告:消费品品牌与工业制造商的数字化成熟度及市场进入策略分析.docx
- 2025年度自然相关财务信息披露报告.docx
- 2025年家庭服务行业消费者购买体验调研报告:人际沟通与 AI 在现代购买决策中的价值分析.docx
- 2025年灵活办公空间技术栈报告:基于调研的核心工具与新兴趋势洞察.docx
- 2025年云技术趋势报告:揭开云计算的未来图景.docx
原创力文档

文档评论(0)