
在 AI 的浪潮之巅,大语言模型(LLM)驱动的多智能体系统,正以其强大的协同能力,不断刷新我们对智能的想象。但一个痛点始终存在:构建这些复杂的系统,往往依赖于“炼丹师”们大量的手动设计和调试,这就像在用手工作坊的方式打造星际飞船,效率低下且难以规模化。
今天,这一瓶颈被彻底打破!来自新加坡国立大学、中国科学技术大学、同济大学和上海人工智能实验室的研究团队,联手推出 MaAS(Multi-agent Architecture Search),一个革命性的自动化框架。
它为古老的 NAS(神经架构搜索)技术注入了智能体时代的灵魂,实现了真正的“按需定制”智能体服务——为不同的任务,动态匹配最合适的智能体架构!论文目前已经被 ICML 2025 录用为 Oral Presentation。

论文标题:
Multi-agent Architecture Search via Agentic Supernet
论文地址:
https://arxiv.org/abs/2502.04180
Github链接:
https://github.com/bingreeky/MaAS

困境:“一刀切”的智能体,是才华的浪费
当前的智能体系统设计,普遍陷入一个“一刀切”的窘境:无论是自动化搜索还是手动搭建,目标都是构建一个“大而全”的静态系统,妄图用一套固定的“万金油”流程解决所有问题。这会带来什么问题?
-
简单任务,高射炮打蚊子:当用户只是问 “1+2*3-2=?”,系统却启动了一套包含多轮反思、辩论的复杂流程,造成巨大的资源浪费。
-
复杂任务,捉襟见肘:当面对“设计一个电商网站后台”这样的艰巨挑战,固定的简单流程又显得力不从心,无法有效完成任务。
我们坚信,未来的智能体系统应当是弹性的、动态的。为此,MaAS 提出了一个全新的范式——智能体超网(Agentic Supernet)。

▲ 图1: 多智能体超网示意图:为不同复杂度的任务,动态采样出最合适的智能体架构。

核心方法:智能体超网,NAS“老树开新花”
MaAS 的核心思想,是将智能体架构的设计问题,从寻找一个“最优单点解”,转变为优化一个概率性的、连续的架构分布——即“智能体超网”。
这个超网,就像一个巨大的智能体“乐高池”,包含了诸如链式思考(CoT)、多智能体辩论(Debate)、ReAct 等各式各样的能力“积木”(Agentic Operators)。MaAS 能从中为每个任务“量体裁衣”。

▲ 图2: MaAS 方法示意图:控制器根据查询,从超网中采样,经环境反馈,通过文本梯度进行优化。](supernet.png)
2.1 按需采样:你的问题,决定了你的智能体系统
当一个查询(Query)到来,MaAS 的控制器(Controller)会立刻对其进行分析,然后像一位智慧的指挥家,从超网中动态采样出一个最适合当前任务的多智能体架构。
-
简单算术题?也许一层简单的 I/O 后,系统就选择了 Early-Exit ,秒速给出答案,干净利落。
-
复杂代码挑战?控制器可能会组建一个包含 ReAct (工具调用)、 Self-Refine (自我修正)和 Debate (多方辩论)的多层深度网络,通过“群策群力”攻克难关。
具体来说,MaAS 的采样过程可以用以下公式表示:

其中, 表示在第 层选择的操作符, 是查询, 是超网络的参数化分布, 是所有可用的操作符集合。通过这种方式,MaAS 能够根据查询的复杂度动态调整采样深度,实现资源的高效利用。
2.2 成本优化:不仅要效果好,更要花钱少
MaAS 的聪明之处不止于此。在优化过程中,它引入了成本约束。通过蒙特卡洛采样和文本梯度(Textual Gradient)技术,MaAS 能够同时优化“性能”与“成本”(如 Token 消耗、API 调用费),在保证高质量输出的同时,把每一分钱都花在刀刃上。优化目标可以表示为:

其中,(C(G; q))是智能体系统(G)对于查询(q)的成本,(lambda)是权衡参数。通过这种方式,MaAS 能够在性能和成本之间取得最佳平衡。

实验验证:性能与成本的“双重胜利”
在实验部分,MaAS 在 GSM8K、MATH、HumanEval、GAIA 等六大主流基准测试中,与 14 个现有顶尖的单智能体、多智能体方法进行了比较。

性能上,MaAS 的平均得分高达 83.59%,相较于现有 SOTA 方法,实现了 0.54%~11.82% 的性能提升,展现了惊人的通用性和有效性。
成本上,更是降维打击!

▲ 图5:成本对比表,MaAS 在训练成本、推理成本和时间上均有巨大优势。
-
推理成本暴降:MaAS 完成任务所需的平均推理成本(Token 消耗等)仅为其他自动化或手动系统的 45%!
-
训练成本悬殊:在 MATH 基准上,MaAS 的训练成本仅为 3.38 美元,而性能相近的 AFlow 则需 22.50 美元,成本相差近 7 倍!
-
优化效率飞跃:MaAS 的优化过程仅需 53 分钟,而其他方法动辄数小时。

▲ 图6:成本分析图

案例展示:杀鸡焉用牛刀,智能体“按需分配”
MaAS 是如何做到“千人千面”的?下图生动地展示了它面对不同难度任务时的“思考路径”。

▲ 图7:案例展示:面对简单问题(上),MaAS浅尝辄止;面对复杂问题(下),则构建深度、并行的智能体网络
可以看到,MaAS 完美地实现了任务难度的动态感知。它“杀鸡绝不用牛刀”,对于简单的任务,在极浅的层数就提前退出;而对于复杂的任务,则毫不犹豫地深入 3-4 层网络,并在每一层激活多个智能体算子并行处理,真正实现了智能资源的最佳配置。

展望:开启智能体架构搜索新纪元
MaAS 的提出,不仅是 NAS 技术在 Agentic 时代的华丽回归,更重要的是,它改变了游戏规则。它将多智能体系统的设计范式从“静态、僵化”推向了“动态、自适应”的新范式。
我们相信,MaAS 为构建下一代高效、经济、可规模化的 AI 应用铺平了道路。未来,无论是教育、科研还是工业界,都可以利用这一框架,为特定场景快速定制出高性价比的智能解决方案。
(文:PaperWeekly)