京东开源“核弹级”多智能体!GAIA 75.15%准确率超越业界知名产品!

 

在AI驱动的自动化浪潮中,多智能体系统正成为企业级应用的先锋,但其复杂性常让开发者望而却步。

最近,京东团队倾力打造并开源了一款产品级的端到端通用多智能体:JoyAgent-JDGenie,首个开源的、完整的多智能体系统,专为实际应用场景设计。

与其他需要大量开发工作才能使用的智能体框架不同,JoyAgent-JDGenie 是一个端到端的产品,开箱即用。是赋能开发者快速实现复杂任务的AI智能体,如生成报告、分析数据和创建演示文稿。

该系统在GAIA基准测试中达到了75.15%的准确率,超过了行业内的许多知名产品,包括OWL、OpenManus等。

核心特性

1、完整的多智能体系统

JoyAgent-JDGenie 提供一个全面集成的多智能体生态系统,包括:

  • • 多种智能体设计模式,支持反应型和规划型方法
  • • 跨多个智能体的上下文管理
  • • 高并发DAG执行引擎,优化性能
  • • 可插拔的子智能体和工具,易于定制
2、高级智能体能力

系统包含专门用于各种任务的智能体:

  • • 报告生成智能体:根据查询创建全面报告
  • • 代码智能体:解释和执行代码
  • • PPT智能体:生成专业演示文稿
  • • 文件智能体:管理文件操作和文档处理

这些智能体可以独立工作或协作解决复杂问题,通过复杂的规划和协调。

3、灵活的输出格式

JoyAgent-JDGenie 支持多种输出格式,满足不同需求:

  • • HTML:用于网页报告和互动内容
  • • PowerPoint:用于专业演示文稿
  • • Markdown:用于文档和文本交付物

所有输出均支持全链路流式处理,提供实时更新,随智能体工作进展。

4、创新方法

JoyAgent-JDGenie 结合了多项突破性创新:多层次和多模式思维

  • • 多层次:在工作层和任务层操作
  • • 多模式:实现规划和执行模式以及反应模式

这种方法使智能体能够更灵活、智能地处理复杂的多阶段任务。

5、跨任务工作流记忆

系统在相似任务间保持记忆,能够从之前的执行中学习并随时间提升性能。这使得系统在获得经验后,响应越来越高效和准确。

6、自动化工具演进

JoyAgent-JDGenie 不再从零创建新工具:

  • • 基于现有工具构建:通过迭代已有组件减少错误
  • • 自动拆解工具为原子操作:将复杂工具分解为基本操作
  • • 自动重新组装新工具:结合原子操作创造新功能

这种方法显著减少了开发工作量,同时提升了工具的可靠性和能力。

核心组成模块

JoyAgent-JDGenie 由四个主要组件构成,彼此无缝协作:

  • • Genie后端:基于Java/Spring Boot的服务,提供核心功能和智能体管理系统
  • • Genie客户端:基于Python的API服务,用于工具管理和执行
  • • Genie工具:包括APIs、协议、提示词和工具执行逻辑的框架
  • • UI:基于React的前端,为用户提供直观界面

这种模块化架构支持灵活部署和定制,同时保持组件间的高效集成。

快速入手

JoyAgent-JDGenie提供了Docker支持,可以通过以下步骤快速部署:

git clone https://github.com/jd-opensource/joyagent-jdgenie.git

cd genie-tool

# 修改.env.example执行工具使用的配置

# 回到根目录

docker build -t genie:latest .

# -v 设置本地存储 -e 设置对话模型
docker run -d -p 3004:3000 -p 8080:8080 -p 1601:1601 -v /Users/{user}/code/autobots/genie/genie-tool:/data/genie-tool -e OPENAI_BASE_URL="" -e OPENAI_API_KEY="" --name genie-app genie:latest

二次开发示例

添加自己的MCP工具到JoyAgent-JDGenie中。

在 genie-backend/src/main/resources/application.yml 添加mcp_server服务,多个server逗号分隔

mcp_server_url: "http://ip1:port1/sse,http://ip2:port2/sse"

启动服务

sh start_genie.sh

开始对话,比如添加12306工具后,查询北京到上海的火车票,效果如下:

新增自定义子Agent到JoyAgent-JDGenie中,实现BaseTool接口,声明工具的名称、描述、参数、调用方法。

/**
 * 工具基接口
 */

public interface BaseTool {
    String getName()// 工具名称
    String getDescription()// 工具描述
    Map<String, Object> toParams()// 工具参数
    Object execute(Object input)// 调用工具
}

// 天气智能体示例
public class WeatherTool implements BaseTool {
    @Override
    public String getName() {
        return "agent_weather";
    }

    @Override
    public String getDescription() {
        return "这是一个可以查询天气的智能体";
    }

    @Override
    public Map<String, Object> toParams() {
        return "{\"type\":\"object\",\"properties\":{\"location\":{\"description\":\"地点\",\"type\":\"string\"}},\"required\":[\"location\"]}";
    }

    @Override
    public Object execute(Object input) {
        return "今日天气晴朗";
    }
}

com.jd.genie.controller.GenieController#buildToolCollection中添加如下代码,引入自定义Agent

WeatherTool weatherTool = new WeatherTool();
toolCollection.addTool(weatherTool);

启动服务

sh start_genie.sh

写在最后

JoyAgent-JDGenie 以其端到端多智能体框架重新定义了AI自动化开发的边界,集成了报告生成、代码生成、PPT制作和文件处理等子智能体,GAIA榜单75.15%的准确率使其在同类工具中脱颖而出。

从前端React界面到后端Spring Boot服务,再到DAG调度引擎,JoyAgent-JDGenie提供了一站式解决方案,开发者只需几行代码即可实现复杂任务自动化。

不是每一个智能体系统都能真正跑起来——JoyAgent-JDGenie 是少数具备“完整产品级闭环能力”的国产多Agent系统。

这类“开箱即用”的 Agent 框架正在成为国产AI竞争力的关键组成部分,强烈建议你深度体验并收藏起来!

GitHub 项目地址:https://github.com/jd-opensource/joyagent-jdgenie

 

● 一款改变你视频下载体验的神器:MediaGo

● 字节把 Coze 核心开源了!可视化工作流引擎 FlowGram 上线,AI 赋能可视化流程!

● 英伟达开源语音识别模型!0.6B 参数登顶 ASR 榜单,1 秒转录 60 分钟音频!

● 开发者的文档收割机来了!这个开源工具让你一小时干完一周的活!

● PDF文档解剖术!OCR神器+1,这个开源工具把复杂排版秒变结构化数据!








(文:开源星探)

发表评论