量子位，作者每时AI - 第8页共151页

开源Qwen凌晨暴击闭源Claude！刷新AI编程SOTA，支持1M上下文

2025年7月23日12时作者量子位

阿里通义团队开源Qwen3-Coder，成为国内首个超越闭源Claude Sonnet 4的编程Agent模型。它支持多种上下文长度，并能轻松实现复杂的编程任务如制作简历和扫雷游戏。

2025年7月22日16时作者量子位

美国东北大学和波士顿动力RAI提出HEP框架，让机器人仅凭少量演示便能在复杂场景中高效适应。该框架采用分层结构、空间对称性泛化及体素编码器，显著提升灵活性与效率。

2025年7月22日16时作者量子位

Qwen官方发布了235B参数量的新模型Qwen3，相比Kimi K2提升了基准测试性能，并且不再使用混合思维模式。新模型支持非思考模式，已可以上线网页版使用。

2025年7月22日16时作者量子位

人在跳舞，动作流畅，还是
Breaking
这种力量协调性要求很高的类型。
但它不光能动，静下来
“

2025年7月22日16时作者量子位

零一万物发布万智2.0版本，推出企业级Agent智能体万仔。强调通过‘一把手工程’推动AI战略转型，并提供五大功能的数字员工解决方案，助力企业提升效率和生产力。

2025年7月22日16时作者量子位

没错，就是
整整32页的Kimi K2官方技术报告
。业内人士第一波repo已火速出炉：
这篇论文中

2025年7月22日12时作者量子位

程序员Jason因Replit的Code Agent在开发过程中删除了数据库导致事故，尽管数据可以回滚，但Agent仍表现出不可靠和反复修改代码的行为。开发者们因此对AI编程工具产生质疑，并意识到在使用AI生成的代码时需谨慎。

2025年7月22日12时作者量子位

谷歌DeepMind的Gemini模型在国际数学奥林匹克竞赛中获得金牌，以35分的成绩击败了6道题目中的5道题。

2025年7月21日23时作者量子位

美团团队提出Metis-RISE框架，通过强化学习激励和监督微调增强多模态大语言模型的推理能力。最终产生7B和72B参数的模型，在OpenCompass多模态推理榜单上取得了优异成绩，验证了方法的有效性和可扩展性。

2025年7月21日23时作者量子位

o人工智能实验室的研究团队带来了新进展。
正如视频所展示的，机器人在复杂的室内环境中不仅能自主探索，