o4-mini-medium 归档

o4-mini暴击六大数学天团，攻破陶哲轩难题！4.5h激战人类阵地失守

2025年5月27日23时作者新智元

不到两年，o4-mini与40位数学家挑战300道菲尔兹奖级难题，一举击败6组团队，碾压人类平均水平。Epoch AI举办比赛考察AI数学能力进展，结果显示AI在FrontierMath上解决了约22%的题目，而人类总体上解决约35%的题目。未来1-2年内，『超级程序员』和『AI数学家』将取得重大突破。

40位数学家组成8队与o4-mini-medium比赛，6队败北

2025年5月24日16时作者机器之心

在FrontierMath基准测试中，O4-mini-medium击败了由数学专家组成的团队。尽管AI尚未达到超人水平，但有观点认为它很快就会超越人类。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31