一道题烧几千美元,OpenAI新模型o3:这34道题我真不会
OpenAI 新模型 o3 在 ARC-AGI 基准测试中取得了显著进步,但仍有部分任务无法解决。o3 能够适应新任务的能力实现了质的飞跃,但仍存在一些局限性。
OpenAI 新模型 o3 在 ARC-AGI 基准测试中取得了显著进步,但仍有部分任务无法解决。o3 能够适应新任务的能力实现了质的飞跃,但仍存在一些局限性。
OpenAI今日发布其最新AI模型o3。在ARC-AGI测试中,o3正确率达到惊人的87.5%,超越了GPT-4仅及格的成绩。它还表现出色的编程和数学能力,并指出其高昂的使用成本(高算力模式下需花费2万美元)。OpenAI表示,尽管o3已表现出强大实力,但仍存在与人类智能的巨大差距。