87.5% 归档 - 每时AI

低调升级，实力暴涨！新版 DeepSeek R1，成了 o3 和 Gemini 2.5 的最强平替

2025年5月30日14时作者 AI信息Gap

DeepSeek R1 推出升级版，推理能力增强、幻觉率下降、支持函数调用，并引入8B小模型辅助教学。新版性能提升显著，已超越开源之王Qwen3。

2024年12月29日20时作者机器之心

OpenAI 新模型 o3 在 ARC-AGI 基准测试中取得了显著进步，但仍有部分任务无法解决。o3 能够适应新任务的能力实现了质的飞跃，但仍存在一些局限性。

2024年12月24日12时作者新智元

新智元报道
编辑：编辑部 JHZ
【新智元导读】
虽然圣诞12日最后一天，o3刷新了ARC-AGI测

2024年12月21日16时作者毫河风报

OpenAI今日发布其最新AI模型o3。在ARC-AGI测试中，o3正确率达到惊人的87.5%，超越了GPT-4仅及格的成绩。它还表现出色的编程和数学能力，并指出其高昂的使用成本（高算力模式下需花费2万美元）。OpenAI表示，尽管o3已表现出强大实力，但仍存在与人类智能的巨大差距。