北卡罗来纳大学教堂山分校归档

MLLM集体翻车，缺乏婴儿级常识！业界首个核心认知基准发布，LeCun转赞

2025年8月4日23时作者新智元

新智元报道
编辑：LRST
ICML 2025研究显示大模型在核心常识测试中表现不佳，呼吁建立坚实基础后再谈高级智能。联合团队开源首个CoreCognition基准评测框架，揭示模型缺乏人类婴幼儿就具备的核心知识问题。