超越o1&QwQ-32B,中科院SolutionRAG大幅提升复杂工程方案设计能力
中科院&通义实验室提出并开源了基于树状探索和双点思维的系统SolutionRAG,用于评估多约束复杂工程问题上的解决方案生成能力。该系统在SolutionBench上取得了最先进的性能,并显著优于现有方法,有望提升实际应用中的工程方案设计自动化和可靠性。
中科院&通义实验室提出并开源了基于树状探索和双点思维的系统SolutionRAG,用于评估多约束复杂工程问题上的解决方案生成能力。该系统在SolutionBench上取得了最先进的性能,并显著优于现有方法,有望提升实际应用中的工程方案设计自动化和可靠性。
腾讯发布混元-T1深度思考模型,在长文捕捉、优化长序列处理及强化学习训练等方面取得突破,已在公开benchmark和内部人工体验集上表现出色。
最近朋友圈被 Manus 刷爆,它能快速生成电影级 CG、训练数字人、筛选简历及24小时带货等。但技术突破引发焦虑,开发者感叹转型困难。为此,DeepSeek 推出系列课程帮助从零开始学习 AI 大模型,涵盖新手装备站和实战经验等内容。
NVIDIA在GTC 2025上发布了基于Llama模型的Nemotron推理系列AI模型,支持128K个标记上下文长度,并推出了新的Agentic AI构建模块加速协作AI系统的开发和应用。
TrustAgent Survey 是一项研究综述工作,系统性地概述了可信大型语言模型代理的安全模块化体系架构,聚焦于凝练 Agent 安全的研究进展,并提出未来研究方向和展望。
《自然语言处理:大模型理论实践》一书全面覆盖从基础到高级的自然语言处理内容,介绍大模型在技术与应用中的进展。文章还提及了华为全联接大会和沃恩智慧的大模型免费试用活动。
Manus热度消退但带动的MCP持续火热,通过MCP让Claude与Blender打通实现3D建模辅助工作;该系统由Blender插件和MCP服务器组成,支持对象操作、材质控制等多任务处理功能,未来可应用于动画、游戏建模。
企业知识可以通过文本、表格和照片三种格式接入Coze。文章介绍了使用RAG方式接入企业私域知识的方法,并对大模型知识、知识库知识及插件知识之间的冲突进行了讨论,同时回顾了RAG的发展历程包括启蒙阶段和技术要点等内容。