机器之心，作者每时AI - 第22页共134页

谢赛宁团队新基准让LLM集体自闭，DeepSeek R1、Gemini 2.5 Pro都是零分

2025年6月19日8时作者机器之心

s（如 GPT-4、Claude、Gemini 等）在代码生成领域取得了显著进展。它们不仅在经典编程

2025年6月18日11时作者机器之心

4D 场景和视频生成，致力于得到一种最佳的物理世界表示模型。其他作者均为 Pico MR 团队核心

2025年6月18日11时作者机器之心

Google发布了Gemini 2.5系列的新版本，包括稳定版和预览版。其中Gemini 2.5 Flash-Lite是性价比最高的模型之一，适用于需要快速处理大量任务的应用场景。

2025年6月17日23时作者机器之心

calable, and
E
fficient Intelligence) Lab，主要参与者为博士

2025年6月17日23时作者机器之心

CMU Infini-Al-Lab 研究人员提出 Multiverse，一种支持原生并行生成的新型生成模型框架，显著提高大语言模型的推理效率和速度。

2025年6月17日16时作者机器之心

港大、camel-ai 等机构提出Workforce多智能体框架及OWL训练方法，在GAIA基准测试上取得69.70%准确率，超越多家商业系统和开源方案。该研究将系统分解为规划器、协调器和工作节点三个核心组件，通过解耦设计实现跨领域迁移，并采用两阶段优化训练策略提升规划器能力。

2025年6月17日16时作者机器之心

Max 和月之暗面各自公布了开源新成果。
其中，MiniMax 启动了「MiniMax Week」，

2025年6月17日16时作者机器之心

本文介绍了一篇被ACL 2025主会议接收的语音语言模型综述论文，该文由香港中文大学团队撰写。文章探讨了当前语音大模型的发展及其在自然对话、实时交互等方面的应用前景，并提出了未来研究的重点和挑战。

2025年6月17日16时作者机器之心

系列炫酷的表演，把人们对机器人的认知从想象拉进了现实。
但当 AI 圈、车圈、互联网圈大佬们纷纷跻身

2025年6月17日16时作者机器之心

着大模型 Scaling Laws 的道路狂奔。
上周三，全球首款 L3 级算力「AI 汽车」小鹏