刚刚,阿里最强编程模型开源!4800亿参数,Agent分数碾Kimi K2,训练细节公开

阿里巴巴Qwen团队发布了其最新编程模型Qwen3-Coder-480B-A35B-Instruct,参数量高达480B,可处理100万上下文输入,并在多项任务中表现优异。该模型已在阿里云平台上线API并开源了智能体编程工具Qwen Code及博客详情。

AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号

UC Berkeley团队提出的新方法Intuitor通过优化模型自身的置信程度来提升大模型的复杂推理能力,无需外部奖励信号或标准答案。与传统强化学习相比,Intuitor能有效减少无效响应并提高模型在数学和代码生成任务中的表现。