5 月 2025 - 第121页共241页

带图推理碾压同类开源模型！港中文微软等开源OpenThinkIMG框架，教AI学会使用视觉工具

2025年5月17日16时作者量子位

港中文和微软联合团队推出OpenThinkIMG开源框架，旨在提升AI视觉工具使用和推理能力。该框架包含模块化视觉工具部署、高效的智能体训练框架及高质量数据生成技术，支持自主学习的V-ToolRL算法显著提升了AI在图表推理任务上的表现。

2025年5月17日16时作者 Z Potentials

OpenAI与数据中心建造商CoreWeave达成40亿美元协议，深化合作。

2025年5月17日16时作者量子位

阿里通义实验室开源ZeroSearch，无需真实搜索引擎即可训练大模型检索-推理能力。通过模拟搜索引擎和课程式学习策略，仅需3B参数的LLM即可有效提升搜索性能，节省API成本，并兼容多种强化学习算法。

2025年5月17日16时作者 APPSO

通过深度学习模型和多模态生成技术，豆包 AI 可以理解和实现模糊的指令需求，实现大量并行生成高质量图片。该服务已应用于创意设计、故事生成等多个领域。

2025年5月17日16时作者 Z Potentials

更多时间思考
时，其推理表现会显著提升，这打破了业界普遍依赖预训练算力的传统认知。
如果我们向
19

2025年5月17日16时作者量子位

OpenAI Codex团队在Reddit AMA活动中分享了Codex的最新消息和未来计划，包括整合多种模型、提高编程效率等。Codex CLI工具使用TypeScript编写，并可在云上运行代码。未来可能推出Pro版本。GPT-5作为新基础模型将提升现有模型的能力。

2025年5月17日16时作者机器之心

重要研究内容，在影视制作、短视频合成和虚拟仿真等方面都有应用价值。现有的商用和开源的视频生成模型，都

2025年5月17日16时作者机器之心

GPT-3 到 GPT-4o，「next-token prediction」以简单粗暴的因果建模横扫