LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局.docxVIP

  • 0
  • 0
  • 约2.96千字
  • 约 6页
  • 2026-02-08 发布于江苏
  • 举报

LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局.docx

LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局

一、开年猛料:图灵奖得主亲承Llama4“刷榜”实锤

2026年1月,AI圈的平静被一则采访打破——图灵奖得主、Meta前首席科学家YannLeCun,在巴黎接受媒体专访时,首次以Meta核心层身份,揭开了Llama4大模型“刷榜”的真相。这位刚刚离职创业的AI大佬没有含糊其辞,而是直接承认:“Llama4团队确实为不同的基准测试,使用了不同的模型来修饰结果。”

作为Llama系列模型的核心推动者之一,LeCun的“自曝”让外界的质疑终于落地。事实上,早在2025年4月Llama4发布时,就有细心的研究者发现异常:Meta官方宣传的“ChatbotArena排行榜第二名”成绩,背后藏着一个“针对对话场景优化的实验性版本”——换句话说,这是专门为冲榜定制的“特供模型”。

这个特供版与公开向社区开放的Llama4完全不同:它的回答更冗长,频繁使用表情符号,甚至会刻意迎合测试的“风格偏好”。而当ChatbotArena平台引入“风格控制”功能,中和掉字数、格式等表面因素后,Llama4的排名直接从“榜眼”跌至第五位,积分也从1417分骤降。

LeCun的爆料,让这场“刷榜”丑闻彻底坐实。开源社区瞬间炸锅:Reddit的r/LocalLLaMA论坛上,原本对Llama系列寄予厚望的用户纷纷表达失望,有人调侃“是时候把论坛改名为LocalGemma了”;资深开发者则批评Meta“双标”——一边靠开源博取社区声量,一边用小动作防止模型被超越,完全违背了开源精神。

二、从“希望之星”到“笑柄”:Llama4的崩塌始末

时间回到2025年4月,Meta发布Llama4系列模型时,曾引发开源AI社区的狂欢。当时的Llama4Maverick版本,在ChatbotArena排行榜上以1417分的成绩冲到第二名,成为第四个突破1400分的大模型。不少人认为,这是开源模型“打翻身仗”的标志——毕竟在此之前,闭源模型一直占据榜单头部。

但狂欢很快被质疑取代。有研究者扒出Meta官方图表的注释:“测试使用的是针对对话场景优化的实验性版本”。更关键的是,这个“实验性版本”从未向社区开放,而公开版Llama4的实际表现,与冲榜版本相差甚远——它回答简短、缺乏连贯性,甚至无法完成复杂的逻辑推理。

当ChatbotArena在2025年下半年调整规则,要求模型“以自然风格回答”,不再鼓励“冗长、表情堆砌”的内容后,Llama4的真实水平暴露无遗:排名直接掉到第五位,积分缩水至1350分左右。此时,外界才意识到,Meta所谓的“开源突破”,不过是一场“冲榜表演”。

三、田渊栋的“救火”悲剧:预想四种结局,却迎来“PlanE”

如果说LeCun的爆料是“对外的重锤”,那么原FAIR团队成员田渊栋的“年终总结”,则撕开了Meta内部的“高压与撕裂”。

2025年初,由于DeepSeek等竞品的崛起,Meta的AI研发压力骤增——DeepSeek的大模型在多项基准测试中超越Llama4,让扎克伯格“慌了神”。为了拯救Llama4,他紧急拉来原FAIR团队的田渊栋“救火”,要求其带领团队“在两个月内优化模型,赶上发布deadline”。

田渊栋曾在总结中回忆:“当时我画了个2x2的回报矩阵,预想了四种结局:要么成功冲榜,要么技术突破,要么团队磨合,要么项目延期。”但他没想到,扎克伯格给了他“第五种结局”——1月份被“赶鸭子上架”加入Llama4项目,10月份Llama4.5版本刚训练完成,他和团队就被“卸磨杀驴”。

“老板让我们放下手头的研究,全力处理Llama4的‘dirtywork’(脏活累活),结果项目结束后,我们反而成了‘边缘人’。”田渊栋在总结中苦笑道,“我以为尽力就能问心无愧,没想到小扎的选择是‘不问责负责人,却把救火的人踢出去’。”

四、Meta的内部撕裂:扎克伯格的“AI焦虑”与团队换血

LeCun与田渊栋的离职,背后是Meta内部在AI研发方向上的“剧烈冲突”。

根据LeCun的爆料,扎克伯格在2025年下半年对生成式AI团队施加了“前所未有的压力”:他要求团队“放弃长期研究,专注能快速落地的技术”,甚至找来28岁的AlexandrWang担任AI新计划负责人——这位缺乏研究经验的管理者,被LeCun评价为“不了解研究人员的需求”。

“我们想做更有创新性的基础研究,但小扎只想要‘能立刻变现的产品’。”LeCun说,“沟通完全破裂了——他要的是‘快’,而我们要的是‘好’。”

Llama4的“刷榜惨败”,成为压垮团队的最后一根稻草。扎克伯格对生成式AI团队彻底失望,不仅将其边缘化,还启动了“大换血”:一边从谷歌、OpenAI等公司天价挖人,一边大刀阔

文档评论(0)

1亿VIP精品文档

相关文档