ICML 2025 Agentic时代唤醒NAS”第二春”!智能体超网动态组队,推理成本暴降55%

在 AI 的浪潮之巅,大语言模型(LLM)驱动的多智能体系统,正以其强大的协同能力,不断刷新我们对智能的想象。但一个痛点始终存在:构建这些复杂的系统,往往依赖于“炼丹师”们大量的手动设计和调试,这就像在用手工作坊的方式打造星际飞船,效率低下且难以规模化。


今天,这一瓶颈被彻底打破!来自新加坡国立大学、中国科学技术大学、同济大学和上海人工智能实验室的研究团队,联手推出 MaAS(Multi-agent Architecture Search),一个革命性的自动化框架


它为古老的 NAS(神经架构搜索)技术注入了智能体时代的灵魂,实现了真正的“按需定制”智能体服务——为不同的任务,动态匹配最合适的智能体架构!论文目前已经被 ICML 2025 录用为 Oral Presentation

论文标题:

Multi-agent Architecture Search via Agentic Supernet

论文地址:

https://arxiv.org/abs/2502.04180

Github链接:

https://github.com/bingreeky/MaAS



困境:“一刀切”的智能体,是才华的浪费

当前的智能体系统设计,普遍陷入一个“一刀切”的窘境:无论是自动化搜索还是手动搭建,目标都是构建一个“大而全”的静态系统,妄图用一套固定的“万金油”流程解决所有问题。这会带来什么问题?


  • 简单任务,高射炮打蚊子:当用户只是问 “1+2*3-2=?”,系统却启动了一套包含多轮反思、辩论的复杂流程,造成巨大的资源浪费。

  • 复杂任务,捉襟见肘:当面对“设计一个电商网站后台”这样的艰巨挑战,固定的简单流程又显得力不从心,无法有效完成任务。

我们坚信,未来的智能体系统应当是弹性的、动态的。为此,MaAS 提出了一个全新的范式——智能体超网(Agentic Supernet)

▲ 图1: 多智能体超网示意图:为不同复杂度的任务,动态采样出最合适的智能体架构。



核心方法:智能体超网,NAS“老树开新花”

MaAS 的核心思想,是将智能体架构的设计问题,从寻找一个“最优单点解”,转变为优化一个概率性的、连续的架构分布——即“智能体超网”。


这个超网,就像一个巨大的智能体“乐高池”,包含了诸如链式思考(CoT)、多智能体辩论(Debate)、ReAct 等各式各样的能力“积木”(Agentic Operators)。MaAS 能从中为每个任务“量体裁衣”。

▲ 图2: MaAS 方法示意图:控制器根据查询,从超网中采样,经环境反馈,通过文本梯度进行优化。](supernet.png)

2.1  按需采样:你的问题,决定了你的智能体系统

当一个查询(Query)到来,MaAS 的控制器(Controller)会立刻对其进行分析,然后像一位智慧的指挥家,从超网中动态采样出一个最适合当前任务的多智能体架构。


  • 简单算术题?也许一层简单的  I/O  后,系统就选择了  Early-Exit ,秒速给出答案,干净利落。

  • 复杂代码挑战?控制器可能会组建一个包含  ReAct (工具调用)、 Self-Refine (自我修正)和  Debate (多方辩论)的多层深度网络,通过“群策群力”攻克难关。

具体来说,MaAS 的采样过程可以用以下公式表示:

其中, 表示在第  层选择的操作符, 是查询, 是超网络的参数化分布, 是所有可用的操作符集合。通过这种方式,MaAS 能够根据查询的复杂度动态调整采样深度,实现资源的高效利用。

2.2 成本优化:不仅要效果好,更要花钱少

MaAS 的聪明之处不止于此。在优化过程中,它引入了成本约束。通过蒙特卡洛采样和文本梯度(Textual Gradient)技术,MaAS 能够同时优化“性能”与“成本”(如 Token 消耗、API 调用费),在保证高质量输出的同时,把每一分钱都花在刀刃上。优化目标可以表示为:

其中,(C(G; q))是智能体系统(G)对于查询(q)的成本,(lambda)是权衡参数。通过这种方式,MaAS 能够在性能和成本之间取得最佳平衡。



实验验证:性能与成本的“双重胜利”

在实验部分,MaAS 在 GSM8K、MATH、HumanEval、GAIA 等六大主流基准测试中,与 14 个现有顶尖的单智能体、多智能体方法进行了比较。

性能上,MaAS 的平均得分高达 83.59%,相较于现有 SOTA 方法,实现了 0.54%~11.82% 的性能提升,展现了惊人的通用性和有效性。


成本上,更是降维打击!

▲ 图5:成本对比表,MaAS 在训练成本、推理成本和时间上均有巨大优势。



  • 推理成本暴降:MaAS 完成任务所需的平均推理成本(Token 消耗等)仅为其他自动化或手动系统的 45%

  • 训练成本悬殊:在 MATH 基准上,MaAS 的训练成本仅为 3.38 美元,而性能相近的 AFlow 则需 22.50 美元,成本相差近 7 倍

  • 优化效率飞跃:MaAS 的优化过程仅需 53 分钟,而其他方法动辄数小时。

▲ 图6:成本分析图



案例展示:杀鸡焉用牛刀,智能体“按需分配”

MaAS 是如何做到“千人千面”的?下图生动地展示了它面对不同难度任务时的“思考路径”。

▲ 图7:案例展示:面对简单问题(上),MaAS浅尝辄止;面对复杂问题(下),则构建深度、并行的智能体网络


可以看到,MaAS 完美地实现了任务难度的动态感知。它“杀鸡绝不用牛刀”,对于简单的任务,在极浅的层数就提前退出;而对于复杂的任务,则毫不犹豫地深入 3-4 层网络,并在每一层激活多个智能体算子并行处理,真正实现了智能资源的最佳配置。



展望:开启智能体架构搜索新纪元

MaAS 的提出,不仅是 NAS 技术在 Agentic 时代的华丽回归,更重要的是,它改变了游戏规则。它将多智能体系统的设计范式从“静态、僵化”推向了“动态、自适应”的新范式。


我们相信,MaAS 为构建下一代高效、经济、可规模化的 AI 应用铺平了道路。未来,无论是教育、科研还是工业界,都可以利用这一框架,为特定场景快速定制出高性价比的智能解决方案。


(文:PaperWeekly)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往