强化学习归档 - 第15页共46页

加速AI编码竞赛！OpenAI上线软件工程代理Codex研究预览版，可并行处理多项任务

2025年5月17日23时作者头部科技

OpenAI发布了Codex研究预览版，这是该公司迄今为止功能最强的AI编码代理。它能够处理多项任务如编写代码、修复错误等，并在专属的云沙盒环境中运行。Codex的发布表明OpenAI可能转向自主构建而非直接收购AI编码产品。

带图推理碾压同类开源模型！港中文微软等开源OpenThinkIMG框架，教AI学会使用视觉工具

2025年5月17日16时作者量子位

港中文和微软联合团队推出OpenThinkIMG开源框架，旨在提升AI视觉工具使用和推理能力。该框架包含模块化视觉工具部署、高效的智能体训练框架及高质量数据生成技术，支持自主学习的V-ToolRL算法显著提升了AI在图表推理任务上的表现。

深度｜OpenAI研究员Dan Roberts：AI主流认知将被打破，未来某个时点强化学习将完全主导整个训练过程

2025年5月17日16时作者 Z Potentials

更多时间思考
时，其推理表现会显著提升，这打破了业界普遍依赖预训练算力的传统认知。
如果我们向
19

图像分词器造反了！华为 Selftok：自回归内核完美统一扩散模型，触发像素自主推理

2025年5月17日16时作者机器之心

GPT-3 到 GPT-4o，「next-token prediction」以简单粗暴的因果建模横扫

刚刚，OpenAI最强编程智能体上线ChatGPT！AI的「终极外挂」来了

2025年5月17日8时作者 APPSO

Codex 是一款基于云端运行的软件工程智能 Agent，可并行处理多个开发任务，协助开发者高效完成编程工作。它通过简单的 UI 设计执行用户描述的任务，支持代码编写、理解代码结构及修复 bug 等功能。

OpenAI深夜炸弹！AI程序员Codex正式“上岗”，程序员颤抖还是一起加班？

2025年5月17日8时作者 AI寒武纪

OpenAI推出Codex云端软件工程智能体，能编写代码、回答问题、修复bug等。用户可通过ChatGPT侧边栏使用Codex，并享受优先体验权。Codex核心引擎codex-1在真实世界中训练，生成的代码风格拟人化。初期支持Pro、Enterprise和Team用户，Plus和Edu用户随后加入。