MLLM集体翻车,缺乏婴儿级常识!业界首个核心认知基准发布,LeCun转赞
新智元报道
编辑:LRST
ICML 2025研究显示大模型在核心常识测试中表现不佳,呼吁建立坚实基础后再谈高级智能。联合团队开源首个CoreCognition基准评测框架,揭示模型缺乏人类婴幼儿就具备的核心知识问题。
新智元报道
编辑:LRST
ICML 2025研究显示大模型在核心常识测试中表现不佳,呼吁建立坚实基础后再谈高级智能。联合团队开源首个CoreCognition基准评测框架,揭示模型缺乏人类婴幼儿就具备的核心知识问题。
本文提出了一种新的长期隐空间记忆扩展框架M+,显著提升了MemoryLLM的有效记忆跨度至160k tokens以上。该研究由Yu Wang和Zexue He完成,通讯作者来自加州大学圣地亚哥分校。
DreamPRM 是加州大学圣地亚哥分校团队开发的一种方法,它在数学推理测评榜上排名第一。通过双层优化框架解决多模态大语言模型的数据质量不均衡问题,显著提升了其数学推理能力。
10岁收到电脑的Rose Yu成长为AI领域的领军人物,她用物理学原理改进了交通、飓风和核聚变预测。现任加州大学圣地亚哥分校副教授,致力于开发AI科学家助手加速科学发现。