北大出手,物理学院天才们教AI「做人」!PHYBench成大模型物理能力试金石 2025年5月1日23时 作者 新智元 理学院联合多个院系,推出了首个专注于物理感知与推理能力的大模型基准——PHYBench。首次系统性揭
北大物院200人合作,金牌得主超50人!PHYBench:大模型究竟能不能真的懂物理? 2025年4月28日23时 作者 机器之心 北大联合人工智能研究院等推出全新物理评测基准PHYBench,包含500道高质量物理题目,旨在评估大模型在物理感知与推理方面的表现,并通过创新的EED评分机制揭示前沿模型与人类专家之间的差距。