北大物院200人合作,金牌得主超50人!PHYBench:大模型究竟能不能真的懂物理?

北大联合人工智能研究院等推出全新物理评测基准PHYBench,包含500道高质量物理题目,旨在评估大模型在物理感知与推理方面的表现,并通过创新的EED评分机制揭示前沿模型与人类专家之间的差距。

ICLR 2025 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM

清华大学计算机系郑凯文与德州大学奥斯汀分校何冠德合作的论文提出扩散桥隐式模型(DBIM),通过引入方差控制参数ρ,显著提升了扩散桥模型(DDBM)在图像翻译和修复任务上的生成质量。