2025年,是时候要拥抱Agent了
2025年,Agent从概念走向商业主流。它是一种自主智能体,具备感知、决策和执行能力,并提供工具调用能力和记忆进化机制。文章推荐开发者参加相关课程,快速了解Agent核心技术原理。
2025年,Agent从概念走向商业主流。它是一种自主智能体,具备感知、决策和执行能力,并提供工具调用能力和记忆进化机制。文章推荐开发者参加相关课程,快速了解Agent核心技术原理。
Chatlog 是一款聊天记录工具,支持从本地数据库文件获取微信等平台的聊天数据,并提供终端界面、命令行工具及HTTP API服务,用于查询聊天记录、联系人、群聊和最近会话信息,同时也支持与支持MCP协议的AI助手集成。
智谱发布GLM-4-32B-0414系列模型,包含基座、推理和沉思模型,支持MIT License,并上线MaaS开放平台。其中推理模型GLM-Z1-32B为国内最快的模型之一,适用于不同场景。通过实测及示例展示了其在问答和功能调用应用中的优势。
统一多模态模型的目标是整合深度理解与丰富的生成能力,MetaQueries采用‘token → [transformer] → [diffusion] → pixels’范式,通过可学习查询和冻结MLLM在保持性能的同时实现图像生成。
热门模型排行榜Top10中出现多款推理大模型,包括代码推理、混合专家视觉-语言模型等。DeepCoder-14B-Preview在LiveCodeBench v5上的准确率提升了8%,仅用140亿参数实现相似性能;Llama-3.1-Nemotron-Ultra-253B-v1基于Meta Llama-3.1-405B-Instruct训练,支持长达128K标记上下文长度。OpenCodeReasoning是最大推理编程合成数据集,用于监督式微调;Kimi-VL-A3B-Thinking在多模态推理和视觉理解方面表现出色;Seed-Thinking-v1.5采用强化学习算法提升模型训练效率。
MetaGPT联合多家机构发布《Foundation Agents》报告,概述智能代理的发展与挑战,涵盖模块化架构、脑区功能映射、自我进化机制、协作与进化multi-Agent系统等多方面内容。
复旦&StepFun开源的OmniSVG能够生成从图标到复杂动漫人物的各种高质量SVG,支持文本转SVG、图像转SVG和字符引用SVG等多种模式,并基于Qwen-VL模型构建,包含MMSVG-2M数据集。
谷歌发布开源协议A2A,允许AI Agent互通互信;补充MCP以提供工具上下文,支持跨平台和云环境管理代理,实现灵活、安全的Agent协作。
ChatWiki 是一款国产开源的知识库 AI 问答系统,结合 GraphRAG 知识图谱技术增强查询效率和答案准确性。支持接入多种大模型,并提供多部署方式、文档发布、格式导入等功能,可嵌入业务系统并与第三方数据打通,支持企业级权限管理与生态对接。