日期: 2025 年 7 月 18 日
大模型竞赛转向:决胜关键为何是“后训练”?|
型。
这款被马斯克称之为“宇宙最强模型”的大模型由20万块GPU组成的Colossus超级计算机集群
AI开发圈地震!Cursor多款模型在中国大陆不能用了,程序员要求退钱
Cursor在中国大陆断供来自Anthropic、谷歌和OpenAI的多款模型,开发者反映失去核心服务,使用国内的AI IDE产品如字节的Trae、阿里云的通义灵码成为替代方案。
2025 IMO真题撕碎AI数学神话,全球顶尖模型齐翻车!冠军铜牌都拿不到
新智元报道
编辑:Aeneas
AI做奥数的神话被戳破!全球顶尖AI模型在最新出炉的2025 IMO数学竞赛中均未通过。即使是冠军Gemini也只得了可怜的31分,无法拿到铜牌。Grok-4更是表现极差,连DeepSeek-R1都令人失望。研究表明,AI想超越人类选手还需进步。
Le Chat全方面对标ChatGPT,欧洲AI新贵穷追不舍
Mistral AI 推出了多款开源模型,并展示了升级后的 Le Chat 模型,其功能几乎与 ChatGPT 一致。Le Chat 新增了深度研究模式、语音模式、原生多语言推理等新特性。
ChatGPT Agent 发布:全整理
OpenAI 发布了 ChatGPT Agent:一个可以连接到各种 API 并执行复杂任务的新智能体。它能生成报告、设计贴纸,并通过多个基准测试超过了人类专家的表现。
大模型Agent工具调用能力训练中的数据构成、Prompt构造及训练工具
今天讨论了大模型训练Agent-tool use的相关数据和工具。主要介绍了MSAgent-Bench-中文Agent数据集以及如何使用这些数据训练文本和多模态Agent,还提到了loss计算的设定方法。