GPT-5刷屏吊胃口之际,英伟达发出暴论:小型语言模型才是未来
英伟达新论文指出,小型语言模型(SLM)更适合AI智能体,无需大型模型完成大部分任务。SLM参数量低于100亿,部署成本低、运行速度快、效果同样出色。英伟达研究发现多数AI智能体任务可由4o-mini级别的SLM胜任。
英伟达新论文指出,小型语言模型(SLM)更适合AI智能体,无需大型模型完成大部分任务。SLM参数量低于100亿,部署成本低、运行速度快、效果同样出色。英伟达研究发现多数AI智能体任务可由4o-mini级别的SLM胜任。
MistralAI发布新模型Mistral-Small-3.2-24B-Instruct-2506,文本能力显著提升,但性能变化不大;主要应用为微调以适应特定领域需求。
浙江大学和哈佛大学团队推出免费开源的ICEdit,相比ChatGPT4o等商业模型,仅需小部分训练数据和参数即可实现高效且强大的图像编辑功能。
OpenAI发布GPT-4.1系列新模型,包括Nano、Mini和GPT-4.1。该系列具有更快、更便宜的处理能力,尤其是GPT-4.1 Nano成为最快的最便宜模型之一。更新的核心是代码能力和指令遵循改进,以及强大的视觉理解能力。
Claude发布混合推理模型Claude 3.7 Sonnet,提升编码和前端Web开发能力,并推出首个编码工具Claude Code。该模型具备两种思考模式,在标准和扩展思维下都能表现优异,还优化了数学、物理等任务的表现。