业界首个开源高完成度轻量化通用多智能体产品(JoyAgent-JDGenie)

解决快速构建多智能体产品的最后一公里问题

简介

当前相关开源agent主要是SDK或者框架,用户还需基于此做进一步的开发,无法直接做到开箱即用。我们开源的JoyAgent-JDGenie是端到端的多Agent产品,对于输入的query或者任务,可以直接回答或者解决。例如用户query"给我做一个最近美元和黄金的走势分析",JoyAgent-Genie可以直接给出网页版或者PPT版的报告文档。

JoyAgent-JDGenie是一个通用的多智能体框架,对于用户需要定制的一些新场景功能,只需将相关的子智能体或者工具挂载到JoyAgent-Genie即可。为了验证JoyAgent-JDGenie的通用性,在GAIA榜单准确率达到75.15%,已超越OWL(CAMEL)、Smolagent(Huggingface)、LRC-Huawei(Huawei)、xManus(OpenManus)、AutoAgent(香港大学)等行业知名产品。

此外,我们的开源多智能体产品JoyAgent-JDGenie相对比较轻量,不像阿里的SpringAI-Alibaba需要依赖阿里云百炼平台相关功能(基于百炼平台调用LLM),Coze依赖火山引擎平台。

我们整体开源了智能体产品JoyAgent-JDGenie,包括前端、后端、框架、引擎、核心子智能体(报告生成智能体、代码智能体、PPT智能体、文件智能体等)、想用微调后效果更好的欢迎使用JoyAgent。

产品对比

分类 agent 是否开源 是否开源完整产品 是否依赖生态
SDK类 SpringAI-Alibaba 部分 否,只开源SDK(SDK) 是(阿里云百炼平台)
Coze 部分 否,只开源部分Nieo SDK(SDK) 是(火山引擎平台)
框架类 Fellow 否,只开源了Eko智能体框架(框架)
Dify 否,只开源了智能体框架,且主要是workflow(框架)
SkyworkAI 否,只开源了智能体框架(框架)
OpenManus 否,只开源了智能体框架(框架)
Owl 否,只开源了智能体框架(框架)
n8n 否,只开源了智能体框架,且主要是workflow(框架)
协议类 MCP 否,只是开源协议
A2A 否,只是开源协议
AG-UI 否,只是开源协议
技术模块类 memory0 否,只是开源的技术模块
LlamaIndex 否,只是开源的技术模块
产品类 Our 是,开源端到端完整的Agent产品(产品)

框架效果先进性

Agent Score Score_level1 Score_level2 Score_level3 机构
Alita v2.1 0.8727 0.8868 0.8953 0.7692 Princeton
Skywork 0.8242 0.9245 0.8372 0.5769 天工
AWorld 0.7758 0.8868 0.7791 0.5385 Ant Group
Langfun 0.7697 0.8679 0.7674 0.5769 DeepMind
JoyAgent-JDGenie(Our) 0.7515 0.8679 0.7791 0.4230 Our
OWL 0.6424 0.7547 0.6512 0.3846 CAMEL
Smolagent 0.5515 0.6792 0.5349 0.3462 Huggingface
AutoAgent 0.5515 0.7170 0.5349 0.2692 HKU
Magentic 0.4606 0.5660 0.4651 0.2308 MSR AI Frontiers
LRC-Huawei 0.406 0.5283 0.4302 0.0769 Huawei
xManus 0.4061 0.8113 0.2791 0.0000 OpenManus

系统架构

本开源项目基于JoyAgent-JDGenie产品开源了整体的产品界面、智能体的多种核心模式(react模式、plan and executor模式等)、多个子智能体(report agent、search agent等)以及多整体间交互协议。

主要特点和优势

  • 端到端完整的多智能体产品,开箱即用,支持二次开发
  • 智能体框架协议
    • 支持多种智能体设计模式
    • 多智能体上下文管理
    • 高并发DAG执行引擎,极致的执行效率
  • 子智能体和工具
    • 子Agent和工具可插拔:预制多种子智能体和工具
    • 多种文件交付样式:html、ppt、markdown
    • plan和工具调用 RL优化迭代
    • 全链路流式输出

主要创新点

multi-level and multi-pattern thinking:结合多种智能体设计模式支持多层级的规划和思考

  • multi-level:work level 和 task level
  • multi-pattern:plan and executor模式和react模式

cross task workflow memory:跨任务级别的相似任务memory

tool evolution via auto-disassembly-and-reassembly of atom-tools

  • 基于已有工具迭代产生新工具,而不是从0-1直接生成新工具(减少错误工具的生成)
  • 基于已有工具隐性拆解为原子工具,并基于原子工具结合大模型自动组合成新工具(不需要花费人力预先定义和拆解原子工具)