MLLM集体翻车,缺乏婴儿级常识!业界首个核心认知基准发布,LeCun转赞

新智元报道
编辑:LRST
ICML 2025研究显示大模型在核心常识测试中表现不佳,呼吁建立坚实基础后再谈高级智能。联合团队开源首个CoreCognition基准评测框架,揭示模型缺乏人类婴幼儿就具备的核心知识问题。

首个开源AI 3D结构化模型,零件级输出3D,AI真正懂了空间这个概念。

首个结构化3D生成模型PartCrafter发布,从单张RGB图像生成多个语义有意义且几何不同的3D网格。支持部件独立编辑、移除或添加,确保全局一致性与细节。

模型遗忘不代表记忆抹除!首次系统发现「可逆性遗忘」背后规律

研究人员首次揭示了大模型在机器遗忘过程中的表示结构变化规律,通过构建统一的表示层分析工具箱,系统性地区分可逆性和不可逆遗忘的本质差异。

CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分

Video-Bench通过链式查询和少样本评分技术,实现了对视频生成质量的高效评估。该框架能够全面覆盖视频生成的多个维度,并在视频-条件一致性、视频质量等方面显著优于现有方法。

20万美元奖金等你来拿!首届WBCD 2025双臂机器人挑战赛全球启幕

首届「What Bimanual Can Do」双臂机器人挑战赛将在ICRA 2025上举办,旨在验证双臂机器人的落地性能。赛事包括物流包装、生命科学实验和餐桌服务三项任务,吸引了88支队伍参赛,并设有多家赞助商提供支持。