就在所有人目光被营销大师凹凸曼和GPT-5牢牢吸引之时,英伟达悄悄抛出了一个反常识的观点:未来属于小型语言模型(SLM)。

英伟达研究院刚刚发布的这一篇新论文,从标题开始就很直白:
「小型语言模型才是AI智能体的未来」。
这篇论文直接挑战了目前几乎所有AI开发者都奉行的基本假设:「智能体必须用类似GPT-4这种级别的大型语言模型(LLM)」。
而论文指出,这个假设完全错了:你根本不需要用LLM来完成80%的真实场景任务。

而为什么SLM会更适合AI智能体呢?
像GPT-4或Claude 3.5这样的大模型确实很强,但大部分智能体的任务本质上都是重复、单一而狭窄的。
对于这些任务而言,SLM不仅足够胜任,甚至表现得更快、更便宜、更高效。

什么是SLM?
简单理解,就是参数量低于100亿的小型语言模型。
如果你还没有概念,那大约就是4o-mini 上下的尺寸。
这样size 的模型不仅可以轻松部署在个人电脑甚至边缘设备上,还有几个显著优势:
-
低延迟,响应快 -
支持离线运行 -
成本远低于大模型

英伟达的研究人员在论文中明确表示:
「大部分AI智能体只做一些狭窄的重复性任务,并不需要70B甚至更多参数的模型,小型语言模型更便宜、更快、且在实际应用中表现同样出色。」
这就是论文要表达的重点。

下显示了两种智能体,并强调即使是控制器角色也可以在调整后的 SLM 上正常运行。
它比较了智能体组织工作的两种方式。

在左侧,一个语言模型与用户聊天并直接触发每个工具,因此整个流程都位于该单个模型中。
在右侧,一个小型控制器程序处理工具调用,让模型专注于对话或特定推理。
这种拆分使得为大多数调用插入小型语言模型变得容易,节省成本,并将大型模型仅保留用于罕见的开放式步骤。
用数据说话:
论文给出,最新的小模型如Phi-3和Hymba,在工具使用、常识推理和指令遵循方面,性能足以媲美30B到70B的大模型,但在实际工作流中的计算量却降低了10-30倍。
简单来说,性能几乎一样,运行却快10倍以上,成本低到令人发指。

英伟达还对三款真实世界的AI智能体进行了测试,结果发现:
-
MetaGPT:60%的任务可以用SLM取代
-
Open Operator:40%的任务可以用SLM取代
-
Cradle(图形界面自动化):70%的任务可以用SLM取代
而这只是目前的SLM,未来还有更大的提升空间。

更关键的是,SLM带来的模块化设计,才是通往类人智能(AGI)的真正途径。
因为人类的推理本身就是模块化的,我们不会用一个超级大脑去解决所有问题,而是有多个专门的工具和技能模块。

伦理和道德层面的优势也不能忽视:

SLM不只是高效,它们更具有道德优势:
-
降低能源消耗
-
保护边缘隐私
-
赋能小团队和社区
如果说LLM将力量集中于少数科技巨头,那么SLM则让AI更加分布式、更民主。
这里你可能要问了:既然SLM如此优秀,怎么还没人开始大量使用呢?

英伟达指出了三个主要原因:
-
大量资金(高达570亿美元)被投入了中心化的大模型基础设施,团队倾向于重复使用付费设置,而不是转向更轻的本地选项,短期内难以转变。 -
行业内对「大即是好」的偏见依然强烈。对小型模型的研究一直在追逐用于大型模型的相同广泛基准,而这些测试错过了小型模型大放异彩的特定于代理的任务。 -
SLM几乎没有GPT-4那样的热度,小模型也错过了让大模型熟悉的名字的营销热潮,因此许多构建者从未尝试过更便宜的路线。
但随着英伟达这篇论文的发布,这种情况可能很快就要改变了。

英伟达甚至直接给出了一个从LLM到SLM迁移的路线图:
-
如何将智能体从LLM迁移到SLM系统 -
如何针对特定任务微调SLM -
如何把任务进行聚类并建立SLM的「技能」 -
如何在本地进行大规模扩展

英伟达最终得出一个大胆的结论:
-
现在大部分AI智能体都设计过度,功能冗余。 -
很多人正在为20倍的成本仅换取微不足道的性能提升。 -
大量用户被锁死在昂贵且中心化的API服务中。
SLM打破了这个限制,而英伟达则为这种大规模转变提供了清晰的依据。
但这并不意味着LLM的时代彻底结束,而是标志着「后GPT时代」的到来:
LLM给了我们火花,而SLM则会成为系统的基础。
下一个一亿个AI智能体,可能不会再使用GPT-4,而是采用更小、更专门、更廉价的模型。
这不是预测,而是将要发生的现实。

最终,决定AI落地的从来都不是模型有多庞大,而是模型有多实用、多高效、多可靠。
英伟达用这篇论文给行业发出了一个严肃的警示:
真正实用的AI智能体,不会建立在泡沫和炒作之上,而将建立在效率和实用性之上。
看完论文,我想到了过去个人电脑时代的崛起——
曾经中心化的超级计算机最终被拆散,进入到每个人的家中。
现在,AI 正在经历同样的历程。
最后,请多听我说一句——
以上,主要还是针对成熟的、极具用户规模的产品而言,英伟达提出的SLM 必须一试。
省钱、还快,就是最大的诱惑。
但,如果你只是在打磨产品阶段,甚至还没有第一位用户,那请听我的:
别犹豫,先用最贵最好的模型。
别在乎成本,有SLM 呢!
Small Language Models are the Future of Agentic AI: https://arxiv.org/html/2506.02153v1
(文:AGI Hunt)