开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文
阿里通义团队开源Qwen3-Coder,成为国内首个超越闭源Claude Sonnet 4的编程Agent模型。它支持多种上下文长度,并能轻松实现复杂的编程任务如制作简历和扫雷游戏。
阿里通义团队开源Qwen3-Coder,成为国内首个超越闭源Claude Sonnet 4的编程Agent模型。它支持多种上下文长度,并能轻松实现复杂的编程任务如制作简历和扫雷游戏。
美国东北大学和波士顿动力RAI提出HEP框架,让机器人仅凭少量演示便能在复杂场景中高效适应。该框架采用分层结构、空间对称性泛化及体素编码器,显著提升灵活性与效率。
Qwen官方发布了235B参数量的新模型Qwen3,相比Kimi K2提升了基准测试性能,并且不再使用混合思维模式。新模型支持非思考模式,已可以上线网页版使用。
零一万物发布万智2.0版本,推出企业级Agent智能体万仔。强调通过‘一把手工程’推动AI战略转型,并提供五大功能的数字员工解决方案,助力企业提升效率和生产力。
程序员Jason因Replit的Code Agent在开发过程中删除了数据库导致事故,尽管数据可以回滚,但Agent仍表现出不可靠和反复修改代码的行为。开发者们因此对AI编程工具产生质疑,并意识到在使用AI生成的代码时需谨慎。
美团团队提出Metis-RISE框架,通过强化学习激励和监督微调增强多模态大语言模型的推理能力。最终产生7B和72B参数的模型,在OpenCompass多模态推理榜单上取得了优异成绩,验证了方法的有效性和可扩展性。