GPT-5刷屏吊胃口之际,英伟达发出暴论:小型语言模型才是未来

就在所有人目光被营销大师凹凸曼和GPT-5牢牢吸引之时,英伟达悄悄抛出了一个反常识的观点:未来属于小型语言模型(SLM)。

英伟达研究院刚刚发布的这一篇新论文,从标题开始就很直白:

「小型语言模型才是AI智能体的未来」。

这篇论文直接挑战了目前几乎所有AI开发者都奉行的基本假设:「智能体必须用类似GPT-4这种级别的大型语言模型(LLM)」。

而论文指出,这个假设完全错了:你根本不需要用LLM来完成80%的真实场景任务。

而为什么SLM会更适合AI智能体呢?

像GPT-4或Claude 3.5这样的大模型确实很强,但大部分智能体的任务本质上都是重复、单一而狭窄的。

对于这些任务而言,SLM不仅足够胜任,甚至表现得更快、更便宜、更高效。

什么是SLM?

简单理解,就是参数量低于100亿的小型语言模型

如果你还没有概念,那大约就是4o-mini 上下的尺寸。

这样size 的模型不仅可以轻松部署在个人电脑甚至边缘设备上,还有几个显著优势:

  • 低延迟,响应快
  • 支持离线运行
  • 成本远低于大模型

英伟达的研究人员在论文中明确表示:

大部分AI智能体只做一些狭窄的重复性任务,并不需要70B甚至更多参数的模型,小型语言模型更便宜、更快、且在实际应用中表现同样出色。

这就是论文要表达的重点。

下显示了两种智能体,并强调即使是控制器角色也可以在调整后的 SLM 上正常运行。

它比较了智能体组织工作的两种方式。

在左侧,一个语言模型与用户聊天并直接触发每个工具,因此整个流程都位于该单个模型中。

在右侧,一个小型控制器程序处理工具调用,让模型专注于对话或特定推理。

这种拆分使得为大多数调用插入小型语言模型变得容易,节省成本,并将大型模型仅保留用于罕见的开放式步骤。

用数据说话:

论文给出,最新的小模型如Phi-3和Hymba,在工具使用、常识推理和指令遵循方面,性能足以媲美30B到70B的大模型,但在实际工作流中的计算量却降低了10-30倍。

简单来说,性能几乎一样,运行却快10倍以上,成本低到令人发指。

英伟达还对三款真实世界的AI智能体进行了测试,结果发现:

  • MetaGPT:60%的任务可以用SLM取代

  • Open Operator:40%的任务可以用SLM取代

  • Cradle(图形界面自动化):70%的任务可以用SLM取代

而这只是目前的SLM,未来还有更大的提升空间。

更关键的是,SLM带来的模块化设计,才是通往类人智能(AGI)的真正途径。

因为人类的推理本身就是模块化的,我们不会用一个超级大脑去解决所有问题,而是有多个专门的工具和技能模块。

伦理和道德层面的优势也不能忽视:

SLM不只是高效,它们更具有道德优势:

  • 降低能源消耗

  • 保护边缘隐私

  • 赋能小团队和社区

如果说LLM将力量集中于少数科技巨头,那么SLM则让AI更加分布式、更民主。

这里你可能要问了:既然SLM如此优秀,怎么还没人开始大量使用呢?

英伟达指出了三个主要原因:

  • 大量资金(高达570亿美元)被投入了中心化的大模型基础设施,团队倾向于重复使用付费设置,而不是转向更轻的本地选项,短期内难以转变。
  • 行业内对「大即是好」的偏见依然强烈。对小型模型的研究一直在追逐用于大型模型的相同广泛基准,而这些测试错过了小型模型大放异彩的特定于代理的任务。
  • SLM几乎没有GPT-4那样的热度,小模型也错过了让大模型熟悉的名字的营销热潮,因此许多构建者从未尝试过更便宜的路线。

但随着英伟达这篇论文的发布,这种情况可能很快就要改变了。

英伟达甚至直接给出了一个从LLM到SLM迁移的路线图:

  • 如何将智能体从LLM迁移到SLM系统
  • 如何针对特定任务微调SLM
  • 如何把任务进行聚类并建立SLM的「技能」
  • 如何在本地进行大规模扩展

英伟达最终得出一个大胆的结论:

  • 现在大部分AI智能体都设计过度,功能冗余。
  • 很多人正在为20倍的成本仅换取微不足道的性能提升。
  • 大量用户被锁死在昂贵且中心化的API服务中。

SLM打破了这个限制,而英伟达则为这种大规模转变提供了清晰的依据。

但这并不意味着LLM的时代彻底结束,而是标志着「后GPT时代」的到来

LLM给了我们火花,而SLM则会成为系统的基础。

下一个一亿个AI智能体,可能不会再使用GPT-4,而是采用更小、更专门、更廉价的模型。

这不是预测,而是将要发生的现实。

最终,决定AI落地的从来都不是模型有多庞大,而是模型有多实用、多高效、多可靠。

英伟达用这篇论文给行业发出了一个严肃的警示:

真正实用的AI智能体,不会建立在泡沫和炒作之上,而将建立在效率和实用性之上。

看完论文,我想到了过去个人电脑时代的崛起——

曾经中心化的超级计算机最终被拆散,进入到每个人的家中。

现在,AI 正在经历同样的历程。




最后,请多听我说一句——

以上,主要还是针对成熟的、极具用户规模的产品而言,英伟达提出的SLM 必须一试。

省钱、还快,就是最大的诱惑。

但,如果你只是在打磨产品阶段,甚至还没有第一位用户,那请听我的:

别犹豫,先用最贵最好的模型。

别在乎成本,有SLM 呢!




[1]

Small Language Models are the Future of Agentic AI: https://arxiv.org/html/2506.02153v1


(文:AGI Hunt)

发表评论