数学推理
国产推理大模型决战2025考研数学,看看谁第一个上岸?
文章介绍了多个深度推理模型在2025年考研数学真题测试中的表现,其中OpenAI的GPT-o1和智谱的GLM-zero-preview表现最佳。
微软 Phi-4 震撼发布:14B 参数模型性能超越 一众大模型,数学推理性能提升显著
微软发布的Phi-4大语言模型在数学推理方面表现出色,准确率达到91.8%。该模型通过高质量合成数据集、精心策划的数据以及先进的后训练技术实现了这一成就,并已在Azure AI Foundry平台发布。