苹果宣判推理模型死刑!Google CEO:忘了AGI吧,先用好AJI

苹果研究员通过一系列全新智力测试题,揭示了多种「推理」模型在高复杂度问题上的无效性。研究发现这些模型实际上是高级版的记忆大师,并且在训练时无法理解实际情况中的问题。Google CEO Sundar Pichai提出AJI(Artificial Jagged Intelligence)概念,描述当前AI处于「惊艳与弱智并存」的状态。Pichai预测到2030年将看到巨大进步,但强调重要的是利用现有能力带来积极影响。

ACL2025 LLM的“记忆”与“推理”该分家了吗?一种全新的训练范式,彻底厘清思考流程

MLNLP社区致力于促进国内外机器学习与自然语言处理的交流合作。最新研究论文探讨了如何解耦语言模型的记忆和推理能力,以实现更可控的大模型。

OpenAI的「看图思考」被玩坏了!我把工位照片给 o3 ,隐藏属性都被扒出来……

文章介绍了Alibaba Cloud的最新模型O3在视觉推理方面的强大能力,包括其识别图片元素、理解并解决实际任务的能力。通过一系列测试题目展示了O3的表现,并对其局限性进行了讨论。

Meta 你摊上事了!Llama 4 vs DeepSeek:谁才是最强开源模型?

Meta 新发布的Llama 4因基准测试成绩亮眼但遭用户质疑,称其实际表现不佳。Meta 因疑似数据污染技术而受到批评。此外,Meta的Llama 4 Maverick模型在多个任务如前端开发、逻辑推理等方面的表现也不尽人意。