近期代表性开源大模型梳理:Decoder转Encoder-Decoder、多模型组合新趋势
近期开源了4个大模型:SmolLM3小模型、T5Gemma模型、NextCoder-32B模型和DeepSeek-TNG-R1T2-Chimera专家组合模型,文章介绍了这些模型的特点及模型合并方案,并推荐MergeKit库来执行模型合并。
企业级智能体开发中所遇到的问题以及解决方案
企业级智能体架构存在单智能体和多智能体两种模式。单智能体开发主要面临工具调用链路长、提示词过长及工具响应错误等问题,而多智能体开发则需解决不同智能体之间数据格式不一致及调度问题。总体而言,智能体开发理论简单但实现复杂。
多模态推理新思路:D2I框架如何让模型“深思熟虑”又“直觉敏锐”?
本文介绍了一种名为 Deliberate-to-Intuitive (D2I) 的推理框架,旨在提升多模态大型语言模型(MLLMs)在复杂推理任务中的表现。通过在训练阶段采用深度推理策略,并在测试阶段允许模型自由生成答案,显著提升了多模态模型的推理能力,同时保持了训练的高效性和可扩展性。
马斯克 Grok 4 来了!史上最强、最贵、最敢说 AI?土耳其:已封杀!
马斯克在发布会上介绍了xAI的新模型Grok 4,表示它达到了博士水平。Grok 4分为标准版和Heavy版本,后者由四个智能体构成,适用于复杂任务。Grok 4的价格为300美元/月或3000美元/年,并且支持多种输入方式和API调用。
PERK:长文本推理的“加速器”,效率与性能双提升
MLNLP社区介绍其论文《PERK: Long-Context Reasoning as Parameter-Efficient Test-Time Learning》,提出了一种通过轻量级适配器在测试时学习长文本上下文的方法,显著降低了训练时的内存需求并提高了长文本推理性能。
仅10行代码,轻松打通你的AI应用与DB:谷歌开源数据库MCP,Star突破4.6k
MCP Toolbox for Databases 是一个开源工具箱,简化数据库开发、管理和安全性的复杂问题,通过集中管理工具和共享智能体与应用程序之间的工具,提高开发效率、性能和安全性。