Yann LeCun:我不玩大模型了,那都是过去式!

Meta首席AI科学家Yann LeCun最近再次强调:「我对LLM不感兴趣了,那都是过去式了!」

这话一出,AI圈又掀起了一波讨论热潮,可对了解LeCun的人来说,这完全不意外!

作为深度学习三巨头之一,他一直对大语言模型持批判态度,认为它们根本不是通往真正AI的正确路径。

早在2023年2月,LeCun就在LinkedIn上发表过他的「不可动摇的观点」,明确表示自回归LLM虽然作为写作辅助工具有用,但它们不会推理和计划,会编造内容,并且终将被更好的系统所取代。

他在视频中说的更加直白:

「我不再对LLM感兴趣了,你知道…它们有点像是最后一件东西了…」

他犀利指出现在的情况:「工业界只是在边缘做些改进,用更多的数据,更多的计算,合成更多的数据…」

这不就是在说OpenAI、Anthropic这些公司都在做的事情嘛!过去几年,这些公司不就是在不断扩大计算规模、数据规模吗?

那LeCun认为更有前途的方向是什么呢?

他给出了四个关键领域

1️⃣ 让机器理解物理世界(这点连NVIDIA的黄仁勋都在关注)

2️⃣ 让AI拥有持久的记忆(很少有人讨论这个问题)

3️⃣ 推理能力

4️⃣ 计划能力

等等,这不就是通往AGI(通用人工智能)的必经之路吗?

这四点恰恰也是LeCun 长期以来批评LLM 最核心的缺陷。

LeCun多次指出自回归LLM缺乏对物理世界的理解,没有持久记忆,无法进行真正的推理,也难以进行复杂规划。

关于推理,LeCun特别补充道:

「当然现在有些人在尝试让LLMs进行推理,但在我看来,这是一种非常简单化的视角…推理可能还有更好的方法。」

LeCun在2023年3月甚至专门发帖论证了为什么自回归LLM是“指数级发散的扩散过程”,表明错误会累积,正确性概率呈指数下降。

他还在今年年初的达沃斯世界经济论坛上,预测五年内没有人会使用现在的生成式AI和大语言模型,因为它们在这四个关键能力上的根本缺陷限制了AI达到真正变革性潜力的可能。

LeCun甚至更大胆预言:「这些方向,可能五年后会让技术社区兴奋不已,但现在看起来不那么令人兴奋,因为都还只是些晦涩难懂的学术论文。」

这其实与他一贯的立场一致。

在最近接受Newsweek采访时,LeCun再次表示相信LLM在五年内将基本过时,他和他的研究团队正在开发一个更好的范式系统,能够进行推理和规划。

网友们看到后反应各异,不少人居然直接开怼:

p🤖w(@noself86) 调侃道:

所以他们先是不是未来,现在又变成了过去?!我就是喜欢听这位老兄说话!哈哈哈哈

Homer(@AchillesSlays) 一句话戳中要害:

他输掉了LLM这场战争,所以葡萄是酸的

随后又补充:

他不是放弃了瞎扯,他只是LLM竞赛中唯一的输家。不过话说回来,他是个天才,我相信他肯定会拿出点好东西让所有人惊讶。我不会低估他。幸好我们有聪明人专注于其他方法。

Anwoy Chatterjee(@anwoy_) 敏锐地指出了矛盾之处:

与此同时,他正在共同撰写关于LLMs的论文

Lovis Odin(@OdinLovis) 则提出了更深层次的思考:

我认为他真的越来越迷失了。首先AI不仅仅是LLM!随着LLM的发展,我们看到的是控制它们的新方式,让它们一起工作。AI领域真正有趣的不是模型本身,而是你在它们周围建立的东西。

Shawn(@Shawnryan96)则直截了当地质疑:

说了这么多,却没有任何成果可以展示。

Victor(@victor_explore)自己也来了一句神总结:

有意见的AI不过是运行时间更长的人类😂

在最近的NVIDIA GTC 2025大会上,LeCun再次放大招,将LLM贬为“token生成器”,并预测五年内没有理智的人会继续使用它们。

这些激进言论引起了广泛争议。

有研究者直接反驳,认为LeCun低估了自回归模型在实践中的功能,忽视了像Chain-of-Thought等技术如何有效克服他所提出的理论缺陷。

更讽刺的是,就在LeCun批评LLM的同时,Meta宣布他们的Llama模型已被下载10亿次,这使得Meta的立场显得矛盾——

一方面,其首席AI科学家将LLM视为死胡同技术。

另一方面,公司却继续大力投资其开发和分发。

LeCun早就多次表示过LLM存在根本性的局限,认为它们:

  • 不理解物理世界

  • 没有持久记忆

  • 无法真正推理

  • 不能层次化规划

而这正是他这次强调的四个未来方向!

这么看来,LeCun对AI的未来路线图一直很清晰:

超越LLM的局限,探索更接近真正智能的方法

在Meta,他正带领团队研发基于JEPA(联合嵌入预测架构)的系统,希望能在未来几年内实现突破。

近期Meta推出了视频联合嵌入预测架构(V-JEPA),能够检测和理解高度详细的物体交互。这被公司称为“朝着Yann LeCun高级机器智能(AMI)愿景迈出的下一步”。

不过,面对其他大公司在LLM领域的成功,LeCun也曾公开表示:下一代开发者应该专注于下一代AI系统,而不是LLM,因为“这已经在大公司手中,你们无法带来什么新东西”

对于AI的未来,LeCun和另外两位深度学习先驱Geoffrey Hinton、Yoshua Bengio的看法截然不同。

有人指出Hinton在最近的一次采访中建议全力投入LLM研发,并认为AI大脑与人类大脑非常接近。

LeCun还在去年5月对下一代开发者喊话,建议他们不要专注于LLM,因为”这已经在大公司手中,你们无法带来什么新东西”,应该“专注于下一代AI系统,突破LLM的局限”。

LeCun认为,未来语言模型可能仍会存在,但会扮演更窄的角色:“LLM的小作用基本上是将抽象思想转化为语言”。

这场AI技术路线之争,谁对谁错,恐怕答案要在未来才能真正揭晓——

是继续在LLM上堆砌计算和数据,还是开辟全新方向探索真正的智能?

LeCun的预言能实现吗?

Meta能凭借JEPA技术实现反超吗?

你怎么看?

(文:AGI Hunt)

《Yann LeCun:我不玩大模型了,那都是过去式!》有1条评论

  1. lecun才是大模型的受益者,名利双收。他和李飞飞的观念一样,都是希望机器能像人类成长的方式走,而不是单纯scaling law

    回复

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往