5 月 2025 - 第36页共241页

多模态模型具备“物理推理能力”了吗？新基准揭示：表现最好的GPT-o4 mini也远不及人类！

2025年5月27日23时作者量子位

香港大学和密歇根大学的研究人员发布首个专门面向多模态大模型物理推理能力的大规模基准测试PhyX，评估结果表明表现最好的GPT-o4 mini准确率仅为45.8%，远不及人类水平。

Google搜索转型，Perplexity入不敷出，AI搜索还是个好赛道吗？

2025年5月27日23时作者 Founder Park

AI 搜索模式 AI Mode，可以应对复杂问题，支持追问。与之前的 AI Overviews 对

MiniMax开源首个视觉RL统一框架，闫俊杰领衔！推理感知两手抓，性能横扫MEGA-Bench

2025年5月27日23时作者量子位

MiniMax提出的新框架V-Triune能够实现视觉任务的统一强化学习，通过三层组件设计和动态IoU奖励机制弥补了传统RL方法无法兼顾多重任务的空白。

Arc浏览器创始人复盘：为何放弃百万用户及产品，押注AI浏览器？

2025年5月27日23时作者 Founder Park

ompany 的转型是一个很典型的故事。
2023 年，Arc 浏览器正式对外推出，在浏览器这个很多

全彩显示的AI眼镜来了！8999元带走阿里大模型和最强光波导

2025年5月27日23时作者量子位

发布了带有
定制大模型和全彩显示
的AI眼镜——X3 Pro。
雷鸟X3 Pro搭载了4nm高通骁龙

o4-mini暴击六大数学天团，攻破陶哲轩难题！4.5h激战人类阵地失守

2025年5月27日23时作者新智元

不到两年，o4-mini与40位数学家挑战300道菲尔兹奖级难题，一举击败6组团队，碾压人类平均水平。Epoch AI举办比赛考察AI数学能力进展，结果显示AI在FrontierMath上解决了约22%的题目，而人类总体上解决约35%的题目。未来1-2年内，『超级程序员』和『AI数学家』将取得重大突破。