传媒行业LLM专题研究(一):长期模型优先,看好coding商业化价值.pptx

传媒行业LLM专题研究(一):长期模型优先,看好coding商业化价值.pptx

悦享投资之美

核心观点

LLM技术发展从预训练架构创新向后训练和推理驱动演绎。我们复盘LLM(LargeLanguageModel)的技术路径发展,2025年以前模型厂商通过堆算力、数据,做大模型参数,从而发挥预训练scalinglaw,打造底模的智能基础,以此锁定继续在AI牌桌上角逐的入场券,即我们认为预训练是大模型竞赛的首要核心壁垒。2025年后以DeepSeekR1为代表的推理模型,发挥RL阶段ScalingLaw,使其成为提升大模型能力的核心手段。展望26年,LLM主流架构基本确定,但行业仍在探索更高效架构,最大化利用算力提升建模效率的路径;此外模型性能改进的核

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档