GPT-5刷屏吊胃口之际,英伟达发出暴论:小型语言模型才是未来
英伟达新论文指出,小型语言模型(SLM)更适合AI智能体,无需大型模型完成大部分任务。SLM参数量低于100亿,部署成本低、运行速度快、效果同样出色。英伟达研究发现多数AI智能体任务可由4o-mini级别的SLM胜任。
英伟达新论文指出,小型语言模型(SLM)更适合AI智能体,无需大型模型完成大部分任务。SLM参数量低于100亿,部署成本低、运行速度快、效果同样出色。英伟达研究发现多数AI智能体任务可由4o-mini级别的SLM胜任。
AI 应用的进化之路:从 RAG 到 Agent,文章探讨了 AI 的系统性架构科学——上下文工程。它超越了简单地回答问题,让 LLM 能够自主规划、使用工具执行任务,并首次系统性拆解其框架。
论文提出 Deep Video Discovery (DVD),通过将长视频分割成多粒度片段并利用LLM推理能力自主规划工具获取信息来回答问题。在最新的推理模型OpenAI o3帮助下,DVI以74.2%准确率超越现有工作,在LVBench上大幅领先。
OpenAI发布o3和o4-mini模型,具备连续调用超过600次工具的能力,超越人类工程师。主要特点包括全面工具访问与推理能力、图像推理能力的突破以及主动式工具使用。