编程任务归档

突破单token预测局限！南洋理工首次将多token预测引入微调，编程任务准确率提升11.67%

2025年7月24日16时作者量子位

南洋理工大学提出CAFT技术，首次将多token预测引入模型微调阶段，实现模型对完整概念的理解，提高编程、数学和医学等多个领域的性能。

2025年7月21日14时作者 AI信息Gap

到一段泄露代码里的“高推理强度”字段，再到一款通用语言模型在 2025 年国际数学奥林匹克（IMO）

2025年7月11日16时作者机器之心

ind 的 AlphaCode 曾宣称达到人类竞技编程选手的水平；OpenAI 的顶尖模型屡屡被报道

2025年7月4日14时作者 AI信息Gap

OpenAI 的 ChatGPT 于 11 月 30 日发布，最初命名‘Chat with GPT-3.5’。产品负责人在最后一刻决定简化为‘ChatGPT’。ChatGPT 凭借简洁的界面和易于上手的特点迅速走红，成为OpenAI历史上最成功的产品之一。

2025年7月3日19时作者 AI信息Gap

马斯克宣布xAI将跳过Grok 3.5，直接发布Grok 4。新模型包含两个版本：Grok 4和Grok 4 Code，具有强大的文本处理能力和编程相关任务支持。但Grok 4存在多模态限制及上下文长度不足的问题。

2025年6月21日16时作者 AI前线

标：年经常性收入 1 亿美元。
更可怕的数字是，据美国一家纸媒报道，Cursor 每日编写 10 亿

2025年5月17日8时作者机器之心

OpenAI 宣布在 ChatGPT 中引入 Codex，一个云端软件工程智能体，能并行处理多项编程任务。Codex 是 codex-1 模型的云原生版本，使用强化学习训练，并具备独立隔离的环境，支持用户直接访问和修改代码库。

2025年5月15日14时作者 AI信息Gap

GPT-4.1 正式上线 ChatGPT，专为编程和指令执行优化。模型拥有百万上下文长度，并在 SWE-bench 编程基准测试中超越了其他模型，提供更快的响应速度和更高的指令跟随准确性。

2025年4月13日16时作者量子位

上线仅三天的Optimus Alpha模型已处理772亿Token，性能优异。它在编程、创意写作等方面表现突出，并被怀疑来自OpenAI。