Codex 实测：OpenAI 的云端 Coding Agent

昨晚，OpenAI 上了个新功能：
Codex，云端的 Coding Agent

Codex 简要概述
这东西，由 3 部分组成：
codex-1 模型、云端沙盒、GitHub 接口封装

不错的产品，交互很赞
但不能自主装依赖，目前干不了活

这个 Agent 的功能大概包含：

• 问答 Git 上的项目
• 跑现成的代码
• 修代码，提 PR（修改代码，然后提交上去）

按 OpenAI 员工的说法，他们部分时候也会拿这个处理代码

用例实测

我必须再次说：这东西目前限制很多，包括不仅限于：

• ❌ 不能联网（不能访问外部 API、网站）
• ❌ 不能临时装依赖（如 pip install 无效）
• ✅ 只能用你仓库里已有的代码 + 你事先配置好的环境

所以这东西，只能做缝补，几乎干不了重活

我能想到的几个典型场景：

• QA 大佬们的代码
• 写一点不需要配环境的代码

QA DeepEP

DeepEP 是之前 DeepSeek 开源的 Infra 框架，我先把它丢进去，选择「询问」就好了

写 Verilog

我本职专业，是EE。

Verlog 这东西，和常规环境没啥关系，但非常依赖 AI 对整体项目的理解，而且完全不能依赖 Rag 代码。

效果是不错的，改改能用（毕竟 o3）。

背后的实现

说真的，这东西的实现并不复杂，相信很快就会有一堆类似的。

分为三块：模型、云端沙盒、打通 GitHub，分别来说说

模型

Codex 背后的模型是 codex-1，通过 o3 调出来的，让风格更贴近「人写的代码」，并且准确性也提升了一些。

以及，发了一个同源的模型：codex-mini-latest，输入 $1.5，输出 $6 每百万 token，比 o4-mini 贵了 30%左右。

调的方法，叫做 Reinforcement Learning，强化微调，之前介绍过：
👉 OpenAI 新货详解：强化微调

云端沙盒

Codex 的代码是跑在云端的，会为每个任务启动一个独立的云端沙盒环境，这环境里：

• 预先拉好你选的 GitHub 仓库（只读）
• 跑你配置好的构建脚本、测试命令、lint 等
• 不联网，也没办法 pip install

大致就是“开了一台干净的服务器”，只装你确认过的东西，它再在里面开始「干活」。

注意：所有修改都只在这个沙盒里完成，Codex 不能直接动你线上仓库的代码，最终得你点按钮发 PR 或下载补丁。

打通 GitHub

Codex 需要你授权 GitHub：

• 你点「Connect GitHub」之后，它会拿到你的仓库只读权限（或者写权限，如果你开了）
• 如果你是团队账户，还要选组织、设定权限范围
• 需要启用 MFA（多因素认证），毕竟你让 AI 有权限提 PR，可以用 Google Auth 或者任何，这里我用的 OnePass

可以吹，别过分

老实讲…
这些任务，不用 Codex 也能完成

这个东西全名叫 Codex Research Preview，单纯 Preview 已经不够了，还得加上 Research，毕竟啥活也干不了，不要有太高的期待

但是，方向是很赞的。

假想一下
你干活干到一半去吃法了，AI 无缝接管了你的环境，继续完成你的工作

总结一下

Codex 是 ChatGPT 新加的远程代码助手。它：

• 产品设计确实不错，放心也很稳
• 云上跑，隔离安全
• 模型靠谱（codex-1 微调自 o3）
• 流程清晰，输出可追溯（log、diff、测试结果）

但：

• 不能联网
• 不能装包
• 只能在你给定的框架里改点东西

保持关注
这个东西全名叫 Codex Research Preview，单纯 Preview 已经不够了，还得加上 Research，目前不要有太高的期待

👉 chatgpt.com/codex

（文：赛博禅心）

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31