开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文
阿里通义团队开源Qwen3-Coder,成为国内首个超越闭源Claude Sonnet 4的编程Agent模型。它支持多种上下文长度,并能轻松实现复杂的编程任务如制作简历和扫雷游戏。
阿里通义团队开源Qwen3-Coder,成为国内首个超越闭源Claude Sonnet 4的编程Agent模型。它支持多种上下文长度,并能轻松实现复杂的编程任务如制作简历和扫雷游戏。
过去半年,开源Agent在解决复杂问题上屡屡受挫,而阿里通义发布的WebSailor模型通过构造L3级别合成数据和DUPO精调算法大幅提升训练效果,为开源Agent挑战闭源系统提供了新思路。
阿里通义团队提出的新范式PARSCALE通过扩展CFG的双路径到P条并行路径,显著提升了1.6B模型的性能,仅占用后者的1/22内存,并将延迟增加量减少至1/6。该方法无需从头训练现有模型(如Qwen-2.5),并在GSM8K数学推理任务中实现了34%的性能提升。