月度归档: 2025 年 5 月
ICML 2025 Spotlight|南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架,准确率提高20%
模型(MLLMs)在视觉问答、推理以及 OCR 等任务上取得了显著的成功。然而,早期的 MLLMs
深夜突袭!OpenAI的AI程序员上线,人类仅需点按钮
OpenAI发布Codex预览版,支持编程、代码审查等任务,具备云端运行和独立隔离环境特性,并推出轻量级版本Codex CLI,定价1.5美元/百万tokens输入。
告别过平滑!浙大团队提出Rankformer:直接优化排序的Transformer架构
研究团队提出基于图Transformer架构的Rankformer推荐模型,该模型专注于排序目标设计,通过模拟梯度下降过程优化表征,聚合全局信息并利用正负样本信号提升推荐精度。
刚刚,OpenAI最强编程智能体上线ChatGPT
OpenAI 宣布在 ChatGPT 中引入 Codex,一个云端软件工程智能体,能并行处理多项编程任务。Codex 是 codex-1 模型的云原生版本,使用强化学习训练,并具备独立隔离的环境,支持用户直接访问和修改代码库。
OpenAI深夜炸弹!AI程序员Codex正式“上岗”,程序员颤抖还是一起加班?
OpenAI推出Codex云端软件工程智能体,能编写代码、回答问题、修复bug等。用户可通过ChatGPT侧边栏使用Codex,并享受优先体验权。Codex核心引擎codex-1在真实世界中训练,生成的代码风格拟人化。初期支持Pro、Enterprise和Team用户,Plus和Edu用户随后加入。
卡内基梅隆大学开源LegoGPT,用AI设计乐高模型
卡内基梅隆大学发布的LegoGPT能够根据文本提示生成物理乐高模型,无需从3D对象创建。它利用语言模型进行自回归文本生成任务,并通过超大规模数据集训练高质量模型。