人形机器人做汉堡火了! 伯克利等全新ViTacFormer让机器人操作稳如老手

一个具备主动视觉、高精度触觉和高自由度灵巧手的人形机器人成功制作了汉堡。该研究提出ViTacFormer,融合视触觉信息并引入未来触觉预测机制,提升操控精度与稳定性。

ICCV 2025 UniOcc: 自动驾驶占用预测与推理统一数据集及基准平台

UniOcc 是首个面向自动驾驶的统一基准框架,融合真实与仿真数据,支持多车协同预测,并引入免真值评估指标。它提供了跨域的数据格式、完整的流注释、分割跟踪工具和免真值评估指标,旨在推动自动驾驶技术的发展。

真实科研水平集体不及格!全新基准SFE给主流多模态LLM来了波暴击

研究团队发布SFE科学评估基准,并构建了SciPrismaX科学评测平台,展示不同大小模型在科学领域的表现。结果显示,最新的MLLMs在高阶推理任务上进步显著,但知识广度变化不大;闭源模型普遍优于开源模型,在可扩展性方面表现出色。研究团队希望构建更严谨、动态且与科研实践深度契合的评估生态。

500万视频数据集+全新评测框架!北大开源主体一致性视频生成领域新基建OpenS2V-Nexus,生成视频 「像」 又 「自然」

北大团队推出OpenS2V-Nexus,包含全球首个面向主体一致性、自然度和文本对齐的S2V细粒度评测基准OpenS2V-Eval及500万高质量720P人物文本视频三元组数据集OpenS2V-5M,解决S2V模型泛化能力差、复制粘贴问题和人物一致性不足等问题。