AIME 2024 归档 - 每时AI

美国最新报告！DeepSeek成全球第二大AI实验室，OpenAI谷歌坐不住了

2025年5月30日16时作者智东西

DeepSeek凭借新版R1模型跃升至全球第二大AI实验室，并在开源领域取得领先优势。其在多项评估中得分显著提升，特别是在编程和数学能力方面表现突出。

2025年4月18日14时作者 AI先锋官

近日，字节跳动发布豆包1.5深度思考模型，该模型在推理能力、速度和多模态方面实现了突破性升级。其参数量为200B，激活参数仅为20B，具有低延迟（<20ms）的优势。通过多项权威基准测试，该模型在数学推理和编程竞赛方面表现出色，并展示了其对图片的视觉推理能力。

2025年1月16日23时作者机器之心

阶跃星辰发布的Step Reasoner mini是首个推理模型，擅长逻辑推理、代码和数学问题，并能进行文学创作。该模型通过强化学习训练，实现文理兼修。它在AIME 2024和Math500测试中均表现出色，且具有较好的泛化性。

2024年12月28日16时作者路过银河AI

DeepSeek V3发布技术报告，其高效能和低算力依赖使其成为当前最强开源基础模型。预训练阶段成本仅为557万美元，性能对标GPT-4o及Claude-3.5-Sonnet。