跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

编程任务

GPT-5 的秘密武器:Universal Verifiers

2025年8月5日12时 作者 AGI Hunt

OpenAI通过Universal Verifier技术提升GPT-5在全领域的性能,解决强化学习中的评判标准难题,使其在编程和复杂任务中表现更佳。

分类 分享 标签 GAN、 Sam Altman、 Universal Verifier、 数学领域、 编程任务、 高质量训练数据 发表评论

突破单token预测局限!南洋理工首次将多token预测引入微调,编程任务准确率提升11.67%

2025年7月24日16时 作者 量子位

南洋理工大学提出CAFT技术,首次将多token预测引入模型微调阶段,实现模型对完整概念的理解,提高编程、数学和医学等多个领域的性能。

分类 资讯 标签 CAFT、 数学推理、 泛化能力、 生物医学、 编程任务、 蛋白质序列 发表评论

GPT-5 倒计时!OpenAI 三连爆:神秘模型、泄露代码、IMO 金牌

2025年7月21日14时 作者 AI信息Gap

到一段泄露代码里的“高推理强度”字段,再到一款通用语言模型在 2025 年国际数学奥林匹克(IMO)

分类 国际、 大模型 标签 GPT-5、 OpenAI、 木易、 编程任务、 通用人工智能、 高推理强度 发表评论

打破大模型编程「数据污染」与「能力虚胖」困境,Meituan-M17团队构建新一代AI编程评测新标准——OIBench

2025年7月11日16时 作者 机器之心

ind 的 AlphaCode 曾宣称达到人类竞技编程选手的水平;OpenAI 的顶尖模型屡屡被报道

分类 学术、 资讯 标签 OIBench、 人机协作、 复杂性、 多样性、 大模型、 编程任务 发表评论

OpenAI 官方播客第二期:ChatGPT 是怎么意外改变世界的?

2025年7月4日14时 作者 AI信息Gap

OpenAI 的 ChatGPT 于 11 月 30 日发布,最初命名‘Chat with GPT-3.5’。产品负责人在最后一刻决定简化为‘ChatGPT’。ChatGPT 凭借简洁的界面和易于上手的特点迅速走红,成为OpenAI历史上最成功的产品之一。

分类 国际、 大模型 标签 ChatGPT、 Claude、 OpenAI、 用户界面、 突破技术、 编程任务 发表评论

马斯克新模型曝光:Grok 4 和 Grok 4 Code 现身 xAI 控制台!

2025年7月3日19时 作者 AI信息Gap

马斯克宣布xAI将跳过Grok 3.5,直接发布Grok 4。新模型包含两个版本:Grok 4和Grok 4 Code,具有强大的文本处理能力和编程相关任务支持。但Grok 4存在多模态限制及上下文长度不足的问题。

分类 国际、 大模型 标签 128K tokens、 xAI、 技术产品经理、 木易、 编程任务、 自然语言处理 发表评论

AI编码工具双雄也开始商业互捧了?Cursor × Claude 最新对谈:两年后,几乎100%代码都将由AI生成!

2025年6月21日16时 作者 AI前线

标:年经常性收入 1 亿美元。
更可怕的数字是,据美国一家纸媒报道,Cursor 每日编写 10 亿

分类 资讯 标签 AI生成代码、 开发人员角色、 指令理解、 智能算法、 用户交互、 编程任务 发表评论

刚刚,OpenAI最强编程智能体上线ChatGPT

2025年5月17日8时 作者 机器之心

OpenAI 宣布在 ChatGPT 中引入 Codex,一个云端软件工程智能体,能并行处理多项编程任务。Codex 是 codex-1 模型的云原生版本,使用强化学习训练,并具备独立隔离的环境,支持用户直接访问和修改代码库。

分类 学术、 资讯 标签 1至30分钟、 Codex、 Codex-1、 OpenAI、 智能体、 编程任务 发表评论

刚刚,OpenAI 官宣:GPT-4.1 免费开放!ChatGPT 用户全体升级!

2025年5月15日14时 作者 AI信息Gap

GPT-4.1 正式上线 ChatGPT,专为编程和指令执行优化。模型拥有百万上下文长度,并在 SWE-bench 编程基准测试中超越了其他模型,提供更快的响应速度和更高的指令跟随准确性。

分类 国际、 大模型 标签 GPT-4.1、 SWE-bench、 国内Top2本科+美国Top10 CS硕士、 推理模型、 木易、 编程任务 发表评论

GPT-4.1偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量OpenAI痕迹

2025年4月13日16时 作者 量子位

上线仅三天的Optimus Alpha模型已处理772亿Token,性能优异。它在编程、创意写作等方面表现突出,并被怀疑来自OpenAI。

分类 资讯 标签 772亿Token、 GPT-4、 OpenAI、 Optimus Alpha、 创意写作Elo分数、 编程任务 发表评论
较早文章
页面1 页面2 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Agent101第五课:开始学习LangGraph
  • 智力触顶?GPT-5要拼体验了
  • GPT-5 之后,我们离 AGI 更近了,还是更远了?
  • 开源UI到代码生成工具!模块化多智能体,精准还原,支持快速原型与前端自动化!
  • GPT-5刚刚正式发布,首次面向免费用户开放

2025 年 8 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 7 月    

归档

  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×