清华大学超级基准测试大模型团队归档 - 每时AI

国产推理大模型决战2025考研数学，看看谁第一个上岸？

2025年1月14日16时作者机器之心

文章介绍了多个深度推理模型在2025年考研数学真题测试中的表现，其中OpenAI的GPT-o1和智谱的GLM-zero-preview表现最佳。