GPT-5刷屏吊胃口之际，英伟达发出暴论：小型语言模型才是未来

就在所有人目光被营销大师凹凸曼和GPT-5牢牢吸引之时，英伟达悄悄抛出了一个反常识的观点：未来属于小型语言模型（SLM）。

英伟达研究院刚刚发布的这一篇新论文，从标题开始就很直白：

「小型语言模型才是AI智能体的未来」。

这篇论文直接挑战了目前几乎所有AI开发者都奉行的基本假设：「智能体必须用类似GPT-4这种级别的大型语言模型（LLM）」。

而论文指出，这个假设完全错了：你根本不需要用LLM来完成80%的真实场景任务。

而为什么SLM会更适合AI智能体呢？

像GPT-4或Claude 3.5这样的大模型确实很强，但大部分智能体的任务本质上都是重复、单一而狭窄的。

对于这些任务而言，SLM不仅足够胜任，甚至表现得更快、更便宜、更高效。

什么是SLM？

简单理解，就是参数量低于100亿的小型语言模型。

如果你还没有概念，那大约就是4o-mini 上下的尺寸。

这样size 的模型不仅可以轻松部署在个人电脑甚至边缘设备上，还有几个显著优势：

低延迟，响应快
支持离线运行
成本远低于大模型

英伟达的研究人员在论文中明确表示：

「大部分AI智能体只做一些狭窄的重复性任务，并不需要70B甚至更多参数的模型，小型语言模型更便宜、更快、且在实际应用中表现同样出色。」

这就是论文要表达的重点。

下显示了两种智能体，并强调即使是控制器角色也可以在调整后的 SLM 上正常运行。

它比较了智能体组织工作的两种方式。

在左侧，一个语言模型与用户聊天并直接触发每个工具，因此整个流程都位于该单个模型中。

在右侧，一个小型控制器程序处理工具调用，让模型专注于对话或特定推理。

这种拆分使得为大多数调用插入小型语言模型变得容易，节省成本，并将大型模型仅保留用于罕见的开放式步骤。

用数据说话：

论文给出，最新的小模型如Phi-3和Hymba，在工具使用、常识推理和指令遵循方面，性能足以媲美30B到70B的大模型，但在实际工作流中的计算量却降低了10-30倍。

简单来说，性能几乎一样，运行却快10倍以上，成本低到令人发指。

英伟达还对三款真实世界的AI智能体进行了测试，结果发现：

MetaGPT：60%的任务可以用SLM取代
Open Operator：40%的任务可以用SLM取代
Cradle（图形界面自动化）：70%的任务可以用SLM取代

而这只是目前的SLM，未来还有更大的提升空间。

更关键的是，SLM带来的模块化设计，才是通往类人智能（AGI）的真正途径。

因为人类的推理本身就是模块化的，我们不会用一个超级大脑去解决所有问题，而是有多个专门的工具和技能模块。

伦理和道德层面的优势也不能忽视：

SLM不只是高效，它们更具有道德优势：

降低能源消耗
保护边缘隐私
赋能小团队和社区

如果说LLM将力量集中于少数科技巨头，那么SLM则让AI更加分布式、更民主。

这里你可能要问了：既然SLM如此优秀，怎么还没人开始大量使用呢？

英伟达指出了三个主要原因：

大量资金（高达570亿美元）被投入了中心化的大模型基础设施，团队倾向于重复使用付费设置，而不是转向更轻的本地选项，短期内难以转变。
行业内对「大即是好」的偏见依然强烈。对小型模型的研究一直在追逐用于大型模型的相同广泛基准，而这些测试错过了小型模型大放异彩的特定于代理的任务。
SLM几乎没有GPT-4那样的热度，小模型也错过了让大模型熟悉的名字的营销热潮，因此许多构建者从未尝试过更便宜的路线。

但随着英伟达这篇论文的发布，这种情况可能很快就要改变了。

英伟达甚至直接给出了一个从LLM到SLM迁移的路线图：

如何将智能体从LLM迁移到SLM系统
如何针对特定任务微调SLM
如何把任务进行聚类并建立SLM的「技能」
如何在本地进行大规模扩展

英伟达最终得出一个大胆的结论：

现在大部分AI智能体都设计过度，功能冗余。
很多人正在为20倍的成本仅换取微不足道的性能提升。
大量用户被锁死在昂贵且中心化的API服务中。

SLM打破了这个限制，而英伟达则为这种大规模转变提供了清晰的依据。

但这并不意味着LLM的时代彻底结束，而是标志着「后GPT时代」的到来：

LLM给了我们火花，而SLM则会成为系统的基础。

下一个一亿个AI智能体，可能不会再使用GPT-4，而是采用更小、更专门、更廉价的模型。

这不是预测，而是将要发生的现实。

最终，决定AI落地的从来都不是模型有多庞大，而是模型有多实用、多高效、多可靠。

英伟达用这篇论文给行业发出了一个严肃的警示：

真正实用的AI智能体，不会建立在泡沫和炒作之上，而将建立在效率和实用性之上。

看完论文，我想到了过去个人电脑时代的崛起——

曾经中心化的超级计算机最终被拆散，进入到每个人的家中。

现在，AI 正在经历同样的历程。

最后，请多听我说一句——

以上，主要还是针对成熟的、极具用户规模的产品而言，英伟达提出的SLM 必须一试。

省钱、还快，就是最大的诱惑。

但，如果你只是在打磨产品阶段，甚至还没有第一位用户，那请听我的：

别犹豫，先用最贵最好的模型。

别在乎成本，有SLM 呢！

[1]

Small Language Models are the Future of Agentic AI: https://arxiv.org/html/2506.02153v1

（文：AGI Hunt）

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

发表评论 取消回复

发表评论取消回复