- 0
- 0
- 约2.96千字
- 约 6页
- 2026-02-08 发布于江苏
- 举报
LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局
一、开年猛料:图灵奖得主亲承Llama4“刷榜”实锤
2026年1月,AI圈的平静被一则采访打破——图灵奖得主、Meta前首席科学家YannLeCun,在巴黎接受媒体专访时,首次以Meta核心层身份,揭开了Llama4大模型“刷榜”的真相。这位刚刚离职创业的AI大佬没有含糊其辞,而是直接承认:“Llama4团队确实为不同的基准测试,使用了不同的模型来修饰结果。”
作为Llama系列模型的核心推动者之一,LeCun的“自曝”让外界的质疑终于落地。事实上,早在2025年4月Llama4发布时,就有细心的研究者发现异常:Meta官方宣传的“ChatbotArena排行榜第二名”成绩,背后藏着一个“针对对话场景优化的实验性版本”——换句话说,这是专门为冲榜定制的“特供模型”。
这个特供版与公开向社区开放的Llama4完全不同:它的回答更冗长,频繁使用表情符号,甚至会刻意迎合测试的“风格偏好”。而当ChatbotArena平台引入“风格控制”功能,中和掉字数、格式等表面因素后,Llama4的排名直接从“榜眼”跌至第五位,积分也从1417分骤降。
LeCun的爆料,让这场“刷榜”丑闻彻底坐实。开源社区瞬间炸锅:Reddit的r/LocalLLaMA论坛上,原本对Llama系列寄予厚望的用户纷纷表达失望,有人调侃“是时候把论坛改名为LocalGemma了”;资深开发者则批评Meta“双标”——一边靠开源博取社区声量,一边用小动作防止模型被超越,完全违背了开源精神。
二、从“希望之星”到“笑柄”:Llama4的崩塌始末
时间回到2025年4月,Meta发布Llama4系列模型时,曾引发开源AI社区的狂欢。当时的Llama4Maverick版本,在ChatbotArena排行榜上以1417分的成绩冲到第二名,成为第四个突破1400分的大模型。不少人认为,这是开源模型“打翻身仗”的标志——毕竟在此之前,闭源模型一直占据榜单头部。
但狂欢很快被质疑取代。有研究者扒出Meta官方图表的注释:“测试使用的是针对对话场景优化的实验性版本”。更关键的是,这个“实验性版本”从未向社区开放,而公开版Llama4的实际表现,与冲榜版本相差甚远——它回答简短、缺乏连贯性,甚至无法完成复杂的逻辑推理。
当ChatbotArena在2025年下半年调整规则,要求模型“以自然风格回答”,不再鼓励“冗长、表情堆砌”的内容后,Llama4的真实水平暴露无遗:排名直接掉到第五位,积分缩水至1350分左右。此时,外界才意识到,Meta所谓的“开源突破”,不过是一场“冲榜表演”。
三、田渊栋的“救火”悲剧:预想四种结局,却迎来“PlanE”
如果说LeCun的爆料是“对外的重锤”,那么原FAIR团队成员田渊栋的“年终总结”,则撕开了Meta内部的“高压与撕裂”。
2025年初,由于DeepSeek等竞品的崛起,Meta的AI研发压力骤增——DeepSeek的大模型在多项基准测试中超越Llama4,让扎克伯格“慌了神”。为了拯救Llama4,他紧急拉来原FAIR团队的田渊栋“救火”,要求其带领团队“在两个月内优化模型,赶上发布deadline”。
田渊栋曾在总结中回忆:“当时我画了个2x2的回报矩阵,预想了四种结局:要么成功冲榜,要么技术突破,要么团队磨合,要么项目延期。”但他没想到,扎克伯格给了他“第五种结局”——1月份被“赶鸭子上架”加入Llama4项目,10月份Llama4.5版本刚训练完成,他和团队就被“卸磨杀驴”。
“老板让我们放下手头的研究,全力处理Llama4的‘dirtywork’(脏活累活),结果项目结束后,我们反而成了‘边缘人’。”田渊栋在总结中苦笑道,“我以为尽力就能问心无愧,没想到小扎的选择是‘不问责负责人,却把救火的人踢出去’。”
四、Meta的内部撕裂:扎克伯格的“AI焦虑”与团队换血
LeCun与田渊栋的离职,背后是Meta内部在AI研发方向上的“剧烈冲突”。
根据LeCun的爆料,扎克伯格在2025年下半年对生成式AI团队施加了“前所未有的压力”:他要求团队“放弃长期研究,专注能快速落地的技术”,甚至找来28岁的AlexandrWang担任AI新计划负责人——这位缺乏研究经验的管理者,被LeCun评价为“不了解研究人员的需求”。
“我们想做更有创新性的基础研究,但小扎只想要‘能立刻变现的产品’。”LeCun说,“沟通完全破裂了——他要的是‘快’,而我们要的是‘好’。”
Llama4的“刷榜惨败”,成为压垮团队的最后一根稻草。扎克伯格对生成式AI团队彻底失望,不仅将其边缘化,还启动了“大换血”:一边从谷歌、OpenAI等公司天价挖人,一边大刀阔
您可能关注的文档
- AI浏览器杀疯了,创业者的机会窗口在哪?.docx
- 一笙长文告别狼队.docx
- 一部悬疑剧集齐了我所有理想型.docx
- 七日无理由退货规则.docx
- 中医医师辨证题及分析.doc
- 京剧“荀派”唱腔的“娇俏活泼”风格解析.docx
- 企业“数字化办公”系统培训方案.docx
- 会议管理中的效率提升技巧.docx
- 体育运动中篮球运动中三分球战术的演变与应用趋势.docx
- 保险理赔时效及案例.docx
- 2022年苏教版九年级物理上册期末试卷及答案【精选】.doc
- 2022年苏教版九年级物理上册期末试卷及答案【完整】.doc
- 2022年苏教版九年级物理上册期末试卷及答案【各版本】.doc
- 2022年苏教版八年级物理(上册)期中强化训练及答案.doc
- 2022年苏教版八年级物理(上册)期中试卷及参考答案(精品).doc
- 2022年苏教版八年级物理(上册)期中总复习及答案.doc
- 2022年苏教版九年级物理上册期末试卷及答案【必考题】.doc
- 2022年苏教版九年级物理上册期末试卷一.doc
- 2022年苏教版九年级物理上册期末试卷及答案2.doc
- 2022年苏教版九年级物理上册期末试卷(汇总).doc
原创力文档

文档评论(0)