加速AI编码竞赛!OpenAI上线软件工程代理Codex研究预览版,可并行处理多项任务

OpenAI发布了Codex研究预览版,这是该公司迄今为止功能最强的AI编码代理。它能够处理多项任务如编写代码、修复错误等,并在专属的云沙盒环境中运行。Codex的发布表明OpenAI可能转向自主构建而非直接收购AI编码产品。

带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架,教AI学会使用视觉工具

港中文和微软联合团队推出OpenThinkIMG开源框架,旨在提升AI视觉工具使用和推理能力。该框架包含模块化视觉工具部署、高效的智能体训练框架及高质量数据生成技术,支持自主学习的V-ToolRL算法显著提升了AI在图表推理任务上的表现。

OpenAI深夜炸弹!AI程序员Codex正式“上岗”,程序员颤抖还是一起加班?

OpenAI推出Codex云端软件工程智能体,能编写代码、回答问题、修复bug等。用户可通过ChatGPT侧边栏使用Codex,并享受优先体验权。Codex核心引擎codex-1在真实世界中训练,生成的代码风格拟人化。初期支持Pro、Enterprise和Team用户,Plus和Edu用户随后加入。

泛化性暴涨47%!首个意图检测奖励范式,AI工具爆炸时代意图识别新解法

腾讯研究团队采用强化学习结合课程采样策略训练意图识别模型,显著提升其在未知意图上的泛化能力。该方法能有效指导模型关注更具挑战性的数据样本,并通过实验验证了GRPO算法优于传统SFT方法的性能优势。

学会用工具看图:准确率碾压GPT-4.1,开源框架让模型拥有“视觉思维”

MLNLP社区致力于促进国内外自然语言处理领域的交流与进步。该社区引入了开源框架OpenThinkIMG以解决现有模型在图表分析中的问题,通过强化学习训练提升AI工具调用效率和准确性。

DanceGRPO:首个统一视觉生成的强化学习框架

本文介绍了一种名为 DanceGRPO 的强化学习框架,在视觉生成任务中实现了统一优化。该方法通过 GRPO 策略在 Diffusion 和 Rectified Flow 模型上进行了测试,并覆盖了文本到图像、视频等多种任务,展示了其在不同基础模型上的有效性及对多种奖励模型的适应性。