MeanFlow再下一城,北大提出机器人学习新范式MP1,实现速度与成功率双SOTA

北大学者提出MP1框架,引入MeanFlow范式提升机器人动作生成速度和泛化能力。该方法实现毫秒级推理速度,且无需外部一致性约束,大幅提高任务成功率和数据效率。

亿级短视频数据突破具身智能Scaling Law!Being-H0提出VLA训练新范式

北京大学卢宗青团队提出创新性解决方案,利用海量人类操作视频数据构建大规模预训练VLA模型Being-H0,并成功应用于真实机器人平台上。该研究解决具身智能领域真机数据不足的问题,提升机器人操作任务的成功率和效率。

500万视频数据集+全新评测框架!北大开源主体一致性视频生成领域新基建OpenS2V-Nexus,生成视频 「像」 又 「自然」

北大团队推出OpenS2V-Nexus,包含全球首个面向主体一致性、自然度和文本对齐的S2V细粒度评测基准OpenS2V-Eval及500万高质量720P人物文本视频三元组数据集OpenS2V-5M,解决S2V模型泛化能力差、复制粘贴问题和人物一致性不足等问题。

ICML 2025 Entropy不灵了?北大港中文用“区域置信”重新定义模型的不确定性

来自北京大学与香港中文大学的最新研究提出 ReCAP 框架,成功打破熵最小化在 Test-Time Training 的性能瓶颈。论文提出区域置信度代理概念,通过优化区域内模型预测不确定性与稳定性之间的联系来提升下游任务泛化性能。