AI Agents+推理,英伟达开源Llama Nemotron系列模型与工具
NVIDIA在GTC 2025上发布了基于Llama模型的Nemotron推理系列AI模型,支持128K个标记上下文长度,并推出了新的Agentic AI构建模块加速协作AI系统的开发和应用。
NVIDIA在GTC 2025上发布了基于Llama模型的Nemotron推理系列AI模型,支持128K个标记上下文长度,并推出了新的Agentic AI构建模块加速协作AI系统的开发和应用。
TrustAgent Survey 是一项研究综述工作,系统性地概述了可信大型语言模型代理的安全模块化体系架构,聚焦于凝练 Agent 安全的研究进展,并提出未来研究方向和展望。
《自然语言处理:大模型理论实践》一书全面覆盖从基础到高级的自然语言处理内容,介绍大模型在技术与应用中的进展。文章还提及了华为全联接大会和沃恩智慧的大模型免费试用活动。
Manus热度消退但带动的MCP持续火热,通过MCP让Claude与Blender打通实现3D建模辅助工作;该系统由Blender插件和MCP服务器组成,支持对象操作、材质控制等多任务处理功能,未来可应用于动画、游戏建模。
企业知识可以通过文本、表格和照片三种格式接入Coze。文章介绍了使用RAG方式接入企业私域知识的方法,并对大模型知识、知识库知识及插件知识之间的冲突进行了讨论,同时回顾了RAG的发展历程包括启蒙阶段和技术要点等内容。
微软GraphRAG自提出已一年。为解决传统RAG在全局查询总结任务上表现不佳问题,微软多部门联合提出Project GraphRAG,并正式开源GraphRAG项目。LazyGraphRAG通过降低数据索引成本,使用NLP名词短语提取和图形统计优化概念图并提取分层社区结构。微软近期发布了2.0版本的LazyGraphRAG,其技术原理包括使用NLP名词短语提取来识别概念及其共现,并利用图形统计优化概念图和提取分层社区结构。
视觉强化微调(Visual-RFT)通过设计特定的可验证奖励函数提升了语言-视觉双向模型在多模态任务中的性能,并展示了其在细粒度图像分类和少样本目标检测等基准测试中的竞争力。
Gemma 3 是一个开源的多模态、多语言 LLM,拥有128k token 的上下文窗口,并提供4种不同大小的模型,支持140多种语言,在LMArena中排名第一。