ii-agent

智能体工作流开源框架 Dify

II-Agent：一个用于构建和部署智能体的全新开源框架。II-Agent 是一款开源智能助手，旨在简化和增强跨领域的工作流程。它代表了我们与技术互动方式的重大进步——从被动工具转变为能够独立执行复杂任务的智能系统。作为简易的COZE，Dify平替。

ii-agent开源框架，擅长构建跨多个领域工作流的Agent，能独立执行复杂任务已是Agent标配其技能覆盖研究与核查、内容生成、数据分析可视化、软件开发、工作流自动化、问题解决6个方面可以用它来做笔记、写文章、做研究、分析数据、写代码、建网站、自动化工作流、故障排除等等，基本上日常工作覆盖的差不多了 ii-agent集成了搜索引擎、代码编辑器、命令行终端等工具，使得它可以处理更复杂的任务，具备持续学习和适应能力给了命令行界面和网页界面两种交互方式。目前正在开发针对PDF、音频、图像、视频、幻灯片等不同模态的处理能力

概述

II Agent 旨在为 Anthropic Claude 模型提供代理接口。它提供以下功能：

用于直接命令行交互的 CLI 界面
支持现代基于 React 的前端的 WebSocket 服务器
与 Google Cloud 的 Vertex AI 集成，通过 API 访问人类学模型

核心能力

II-Agent 是一款多功能开源助手，旨在提升您在各个领域的工作效率：

领域	II-Agent 的功能
研究与事实核查	多步网页搜索、源三角测量、结构化笔记、快速摘要
内容生成	博客和文章草稿、课程计划、创意散文、技术手册、网站创作
数据分析与可视化	清理、统计、趋势检测、图表和自动报告生成
软件开发	跨多种语言的代码合成、重构、调试、测试编写和分步教程
工作流自动化	脚本生成、浏览器自动化、文件管理、流程优化
解决问题	分解、替代路径探索、逐步指导、故障排除

方法

II-Agent 系统代表了一种构建多功能 AI 代理的复杂方法。我们的方法论核心在于：

核心代理架构与LLM交互
- 动态定制上下文的系统提示
- 全面的交互历史管理
- 智能上下文管理来处理令牌限制
- 系统性LLM调用和能力选择
- 通过执行周期进行迭代改进
规划与反思
- 解决复杂问题的结构化推理
- 问题分解和顺序思考
- 透明的决策过程
- 假设的形成和检验
执行能力
- 具有智能代码编辑的文件系统操作
- 在安全环境中执行命令行
- 高级 Web 交互和浏览器自动化
- 任务完成和报告
- 针对各种模式的专门功能（实验性）（PDF、音频、图像、视频、幻灯片）
- 深度研究整合
上下文管理
- 代币使用情况估算和优化
- 针对冗长互动的战略性缩短
- 基于文件的大型输出存档
实时通信
- 基于 WebSocket 的交互使用界面
- 每个客户端的独立代理实例
- 流式传输操作事件以实现响应式用户体验

GAIA 基准评估

II-Agent 已根据 GAIA 基准进行了评估，该基准评估基于 LLM 的代理在多维度（包括多模式处理、工具利用和网络搜索）的现实场景中的运行情况。

我们在评估过程中发现了 GAIA 基准的几个问题：

注释错误：数据集中存在一些不正确的注释（例如，误解日期范围、计算错误）
过时的信息：一些问题涉及不再可访问的网站或内容
语言歧义：措辞不明确导致对问题的不同解释

尽管面临这些挑战，II-Agent 在基准测试中表现出色，特别是在需要复杂推理、工具使用和多步骤规划的领域。

您可以在此处查看一些样本的完整跟踪：GAIA 基准跟踪

要求

Python 3.10+
Node.js 18+（用于前端）
已启用 Vertex AI API 或 Anthropic API 密钥的 Google Cloud 项目

环境

环境变量

.env在根目录中创建一个包含以下变量的文件：

# Image and Video Generation Tool
OPENAI_API_KEY=your_openai_key
OPENAI_AZURE_ENDPOINT=your_azure_endpoint
# Search Provider
TAVILY_API_KEY=your_tavily_key
#JINA_API_KEY=your_jina_key
#FIRECRAWL_API_KEY=your_firecrawl_key
# For Image Search and better search results use SerpAPI
#SERPAPI_API_KEY=your_serpapi_key 

STATIC_FILE_BASE_URL=http://localhost:8000/

#If you are using Anthropic client
ANTHROPIC_API_KEY=
#If you are using Goolge Vertex (recommended if you have permission extra throughput)
#GOOGLE_APPLICATION_CREDENTIALS=

前端环境变量

对于前端，.env在前端目录中创建一个文件：

NEXT_PUBLIC_API_URL=http://localhost:8000

安装

克隆存储库

设置Python环境：

python -m venv .venv
source .venv/bin/activate  # On Windows: .venv\Scripts\activate
pip install -e .

设置前端（可选）：
```
cd frontend
npm install
```

用法

命令行界面

如果要使用人类客户端，请在文件ANTHROPIC_API_KEY中设置.env并运行：

python cli.py

如果要使用顶点，请在文件GOOGLE_APPLICATION_CREDENTIALS中设置.env并运行：

python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION

选项：

--project-id：Google Cloud 项目 ID
--region：Google Cloud 区域（例如 us-east5）
--workspace：工作区目录的路径（默认值：./workspace）
--needs-permission：执行命令前需要权限
--minimize-stdout-logs：减少打印到标准输出的日志量

Web 界面

启动 WebSocket 服务器：

使用 Anthropic 客户端时：

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000

使用 Vertex 时：

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000 --project-id YOUR_PROJECT_ID --region YOUR_REGION

启动前端（在单独的终端中）：

cd frontend
npm run dev

打开浏览器访问http://localhost:3000

项目结构

cli.py：命令行界面
ws_server.py：前端的 WebSocket 服务器
src/ii_agent/：核心代理实现
- agents/：代理实现
- llm/：LLM 客户端接口
- tools/：工具实现
- utils/：实用功能

结论

II-Agent 框架基于 Claude 3.7 Sonnet 等大型语言模型的推理能力构建，为构建多功能 AI 代理提供了全面而强大的方法。II-Agent 结合了强大的 LLM、丰富的执行能力、明确的规划和反思机制以及智能上下文管理策略，能够出色地处理各种复杂的多步骤任务。其开源特性和可扩展设计为快速发展的代理 AI 领域的持续研究和开发奠定了坚实的基础。

Eliza - 多AI智能体模拟框架

<p><strong>Eliza</strong> 是由 ai16z 开源的一款多代理模拟框架，旨在帮助开发者<strong>创建、部署和管理</strong>自主 AI 智能体。该框架基于 <strong>TypeScript</strong> 开发，提供了一个灵活且可扩展的平台，让 AI 代理能够在多个社交平台上与人类进行互动，同时保持一致的个性和知识。</p><h3>核心功能</h3><ul><li>多代理架构：Eliza 能够同时部署和管理多个拥有独特个性的 AI 代理，并支持在不同场景下的多代理交互。</li><li>多平台集成：框架支持与 Discord、Twitter、Telegram 等主流社交平台无缝连接，让 AI 代理能够轻松地与用户进行跨平台交互。</li><li>多模型兼容：Eliza 支持多种主流 AI 模型，包括 Llama、Grok、OpenAI、Anthropic 等，为您提供了灵活的模型选择，以适应不同需求。</li><li>记忆与文档交互：通过先进的检索增强生成系统（RAG），Eliza 为 AI 代理提供了长期记忆和可感知的上下文管理功能，让它们能够记住对话历史和文档内容，从而提供更连贯、个性化的响应。</li><li>高度可扩展性：框架采用模块化设计，并提供全面的 API，用户可以创建自己的动作和客户端，轻松扩展功能以适应特定应用场景。</li></ul><p><br></p><h3>应用场景</h3><ul><li>聊天机器人：Eliza 可用于构建聊天机器人，提供客户支持、社区管理和个人助理等服务。</li><li>业务流程自动化：作为自主 AI 代理，Eliza 能够在业务流程处理和自动化交易等领域执行复杂的任务和决策。</li><li>视频游戏 NPC：在游戏开发中，Eliza 可以创建具有自然语言交流能力的 NPC（非玩家角色），从而提升游戏的沉浸式体验。</li></ul><p><br></p><h3>项目地址</h3><ul><li>GitHub 仓库：https://github.com/elizaOS/eliza</li></ul>

Shipable-零代码创建自动化工作流

<p>Shipable 是一款专为用户设计的无代码人工智能代理平台，旨在帮助您快速、高效地<strong>构建、定制和部署</strong>智能 AI 代理，实现复杂任务的自动化。</p><p>通过其<strong>可视化构建器</strong>，用户无需任何编程知识，即可轻松创建多语言自动化工作流，并结合系统提示和应用程序集成，让您的 AI 代理不仅能智能回复，更能执行实际操作，如预订、更新等，从而显著提升工作效率。</p><h3>核心功能</h3><ul><li>无代码构建：通过直观的可视化构建器，您可以轻松创建复杂的多语言自动化工作流，实现任务自动化，无需编写任何代码。</li><li>快速部署：支持将 AI 代理快速部署到各种平台，包括您自己的域名、Slack、Shopify 等，将想法快速变为现实。</li><li>强大集成：与 Slack、Notion、CRM 等超过 1000 个常用工具无缝集成，自动连接您的工作流程，告别手动操作。</li><li>多语言支持：平台支持超过 28 种语言，包括阿拉伯语，让您能够部署真正理解方言的语音代理，拓展全球市场。</li><li>智能回复与执行：您的 AI 代理不仅能进行智能对话，还能执行实际任务，如预订、更新数据等，真正将效率提升到新的高度。</li><li>数据分析：提供全面的数据分析功能，帮助您持续优化 AI 代理的性能，提升客户体验。</li></ul><h3>应用场景</h3><p>Shipable 广泛应用于各类企业和个人场景，帮助您实现自动化工作：</p><ul><li>客户支持：构建智能客服代理，自动处理客户咨询和常见问题，提升响应速度和客户满意度。</li><li>营销与销售：创建智能聊天机器人，自动引导潜在客户、提供产品信息和安排会议，提高营销效率和销售转化率。</li><li>内部工作流优化：自动化团队内部任务，如数据录入、文件处理和日程安排，从而提高整体工作效率。</li><li>内容创作与互动：为创作者提供自动回复评论、生成内容创意等工具，增强与受众的互动和参与度。</li><li>企业级应用：为大型企业提供定制化的 AI 解决方案，支持多语言和复杂工作流程，全面提升企业运营效率。</li><li>官网地址：https://www.shipable.ai/</li></ul>

Neovate Code - 蚂蚁集团开源的智能编程助手

<p style="text-align: left; line-height: 2;">Neovate Code 是蚂蚁集团开源的<a href="https://ai-bot.cn/best-ai-coding-assistant-tools/" target="_blank">智能编程助手</a>，专注于提升开发效率。工具能深度理解代码库，遵循既有编码习惯，精准完成代码生成、Bug修复和重构等任务。通过对话式界面，支持开发者用自然地描述需求，Neovate Code 提供安全、可控的实现方案。工具支持多种流行模型（如 OpenAI、Anthropic 等），可通过插件系统灵活扩展功能。目前以 CLI 工具形式提供，未来将适配更多客户端形态，满足不同开发场景需求。</p><h2 style="text-align: left;">Neovate Code 的主要功能</h2><ul><li style="text-align: left;"><strong>对话式开发</strong>：提供自然对话界面，开发者用自然语言描述编程需求，Neovate Code 理解、生成相应代码，让编程更直观高效。</li><li style="text-align: left;"><strong>AGENTS.md 规则文件</strong>：开发者可创建 <span style="color: rgb(232, 62, 140); background-color: rgba(130, 130, 130, 0.1);"><code>AGENTS.md</code></span> 文件定义项目自定义规则和行为，Neovate Code 根据规则生成符合项目要求的代码，确保代码风格一致。</li><li style="text-align: left;"><strong>会话继续和恢复</strong>：支持跨会话继续之前的工作，开发者无需重新输入指令或上下文信息，节省时间和精力。</li><li style="text-align: left;"><strong>支持流行的模型和提供商</strong>：支持 OpenAI、Anthropic、Google 等多种主流 AI 模型，通过配置环境变量中的 API Key，开发者能快速切换和使用不同模型。</li><li style="text-align: left;"><strong>斜杠命令</strong>：提供斜杠命令（如 <span style="color: rgb(232, 62, 140); background-color: rgba(130, 130, 130, 0.1);"><code>/login</code></span>、<span style="color: rgb(232, 62, 140); background-color: rgba(130, 130, 130, 0.1);"><code>/model</code></span> 等），用在快速执行常用操作，如配置 API Key 或切换模型。</li><li style="text-align: left;"><strong>输出样式</strong>：开发者能自定义代码更改的呈现方式，Neovate Code 根据设置生成符合开发者习惯的代码输出，提升代码可读性。</li><li style="text-align: left;"><strong>计划模式</strong>：提供实现计划供开发者审查，确认无误后再执行，确保代码生成的准确性和安全性。</li><li style="text-align: left;"><strong>无头模式</strong>：支持无头模式，可在没有交互提示的情况下自动化工作流，适用 CI/CD 等自动化场景。</li><li style="text-align: left;"><strong>插件系统</strong>：提供插件系统，开发者能编写插件扩展功能，如添加新模块、集成工具或适配开发环境。</li><li style="text-align: left;"><strong>MCP（模型上下文协议）</strong>：支持 MCP，用在增强集成的模型上下文协议，支持在不同模型间共享上下文信息，确保代码生成的一致性和连贯性。</li><li style="text-align: left;"><strong>Git 工作流</strong>：与 Git 工作流无缝集成，支持智能提交消息和分支管理，开发者能直接在 Neovate Code 中生成提交消息、管理代码分支。</li></ul><h2 style="text-align: left;">如何使用Neovate Code</h2><ul><li style="text-align: left;">安装 Neovate Code：打开终端或命令行工具。输入以下命令进行安装：npm install -g @neovate/code</li><li style="text-align: left;"><strong>启动 Neovate Code</strong>：安装完成后，输入以下命令启动 Neovate Code：<span style="color: rgb(232, 62, 140); background-color: rgba(130, 130, 130, 0.1);"><code>neovate</code></span></li><li style="text-align: left;"><strong>配置 API Key</strong>：</li><li style="text-align: left;">选择模型：完成 API Key 配置后，输入 /model。选择该提供商下可用的模型。</li><li style="text-align: left;">开始使用：在命令行中描述开发需求，例如：“在用户认证函数中添加错误处理。”“将这个组件重构为使用 TypeScript。”“为支付服务创建单元测试。”</li><li style="text-align: left;">利用其他功能：如果需要继续之前的工作，用会话继续和恢复功能。使用斜杠命令（如 /help）获取帮助或执行其他操作。自定义输出样式或通过 AGENTS.md 文件为项目定义规则。开启计划模式以审查实现计划，或启用无头模式自动化工作流。</li></ul><h2 style="text-align: left;">Neovate Code的项目地址</h2><ul><li style="text-align: left;"><strong>项目官网</strong>：https://neovateai.dev/</li><li style="text-align: left;"><strong>GitHub仓库</strong>：https://github.com/neovateai/neovate-code</li></ul>

VibeFlow

<p style="text-align: left; line-height: 2;">VibeFlow 是创新的<a href="https://ai-bot.cn/ai-agent-development-platform/" target="_blank">无代码开发平台</a>，支持用户通过自然语言描述来构建全栈 Web 应用。用户只需输入简单的提示词，VibeFlow 的 AI 引擎能自动生成完整的后端逻辑，以可视化工作流的形式呈现出来。用户可以轻松地查看、编辑和扩展应用逻辑，无需编写代码。VibeFlow 内置了数据库和多种服务集成，进一步简化了开发流程。适用创业者、产品经理或是无代码爱好者，可以用 VibeFlow 快速将创意转化为实际应用，实现从 0 到 1 的快速开发和迭代。</p><h2 style="text-align: left;">VibeFlow的官网地址</h2><ul><li style="text-align: left;"><strong>官网地址</strong>：https://app.vibeflow.ai/</li></ul>

Launch

<p>Launch 是基于人工智能帮助用户快速构建全栈应用的工具。用户无需具备深入的编程知识或开发团队，只需通过简单的文字提示，能生成包含前端、后端、数据库、用户认证和支付功能的完整应用。平台主打快速、高效，适合创业者、初创公司或个人开发者快速验证产品创意并上线。提供直观的界面和无代码开发体验，让用户专注于产品逻辑而非技术细节，降低开发门槛。</p> <h2 style="font-size: 20px;">Launch的主要功能</h2> <ul> <li> <div class="paragraph">AI 驱动的应用生成：用户通过文字提示，可生成包含前端、后端和数据库的完整应用。</div> </li> <li> <div class="paragraph">用户认证集成：平台自动生成 Google 认证等登录功能，支持用户快速注册和登录。</div> </li> <li> <div class="paragraph">支付系统支持：内置支付模块，方便用户快速集成支付功能。</div> </li> <li> <div class="paragraph">实时 UI 与逻辑连接：生成的应用界面和逻辑直接连接，无需手动调整代码。</div> </li> <li> <div class="paragraph">无代码开发体验：用户无需编写代码，通过提示即可完成产品开发。</div> </li> <li> <div class="paragraph">快速产品上线：支持从创意到上线的快速迭代，缩短开发周期。</div> </li> <li> <div class="paragraph">模板与定制化：提供基础模板，同时支持用户根据需求进行定制。</div> </li> </ul> <h2 style="font-size: 20px;">Launch的官网地址</h2> <ul> <li>官网地址：https://app.launch.today/</li> </ul>

Mocha

<p>Mocha 是 AI 驱动的无代码应用构建平台，帮助创业者和非技术用户快速将应用想法转化为实际产品。用户只需通过自然语言描述应用需求，Mocha 的 AI 引擎即可生成完整的应用框架，无需编写代码。平台支持实时预览和迭代，用户可以随时调整设计、添加功能或上传图片，在满意后一键发布应用。</p> <h2 style="font-size: 20px;">官网地址</h2> <ul> <li>官网地址：https://getmocha.com/</li> </ul> <p> </p>

Seed Diffusion

<p>Seed Diffusion是字节跳动Seed团队推出的实验性扩散语言模型，专注于代码生成任务。模型通过两阶段扩散训练、约束顺序学习和强化高效并行解码等关键技术，实现显著的推理加速。模型的推理速度达到2146 tokens/s，比同等规模的自回归模型快5.4倍，在多个代码基准测试中表现与自回归模型相当，在代码编辑任务上超越自回归模型。Seed Diffusion展示了离散扩散模型作为下一代生成模型基础框架的巨大潜力。</p> <h2 style="font-size: 20px;">Seed Diffusion的主要功能</h2> <ul> <li>高效代码生成：通过并行解码机制，显著提升代码生成的速度，推理速度可达 2146 tokens/s，相比同等规模的自回归模型提升 5.4 倍。</li> <li>高质量代码生成：在多个代码基准测试中，性能与自回归模型相当，在代码编辑任务上超越自回归模型。</li> <li>代码逻辑理解与修复：基于两阶段扩散训练（掩码阶段和编辑阶段），增强模型对代码逻辑的理解和修复能力。</li> <li>灵活的生成顺序：引入代码的结构化先验，让模型能更好地处理代码的因果依赖关系。</li> </ul> <h2 style="font-size: 20px;">Seed Diffusion的项目地址</h2> <ul> <li>项目官网：https://seed.bytedance.com/zh/seed_diffusion</li> <li>技术论文：https://lf3-static.bytednsdoc.com/obj/eden-cn/hyvsmeh7uhobf/sdiff_updated.pdf</li> <li>在线体验Demo：https://studio.seed.ai/exp/seed_diffusion/</li> </ul>

Kiro

<p>Kiro是一款Agentic IDE——简单来说，它不仅是一个AI编码助手，更是一个帮你从灵感到上线、从混乱到清晰的开发搭档。</p> <p>它不仅擅长“Vibe Coding”，更强大之处在于：它能将这些原型，推进到真正可上线的系统。而这一切，都依赖于两个核心能力：Specs（Specification）和Hooks（自动化触发器）。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/07/16/1752699111_e5MdyshMT1.png"></p> <p> </p> <p>vide coding和spec-driven development的区别</p> <p>Kiro下载页面：</p> <p>https://kiro.dev/downloads</p> <p>实践教程：</p> <p>https://kiro.dev/docs/guides/learn-by-playing/</p>

Gemini CLI

<p>Gemini CLI 是谷歌开源的 AI Agent，将 Gemini 大模型融入开发者终端。Gemini CLI提供强大 AI 功能，如代码理解、文件操作、命令执行及动态排查问题，助力开发者高效编写代码、修复错误、构建功能和迁移代码。Gemini CLI内置谷歌搜索，支持 MCP 协议，支持扩展数千功能，Gemini CLI支持用户定制提示和指令，能集成到脚本中实现自动化任务。Gemini CLI与谷歌的 AI 编程助手 Gemini Code Assist 集成，实现可自定义的自动化编程。</p> <h2 style="font-size: 20px;">Gemini CLI的项目地址</h2> <ul> <li>项目官网：https://blog.google/technology/developers/introducing-gemini-cli-open-source-ai-agent/</li> <li>GitHub仓库：https://github.com/google-gemini/gemini-cli</li> </ul>

bubble

<p>Bubble 是领先的无代码应用开发平台，通过可视化编程的方式，让用户无需编写代码即可构建和发布功能齐全的 Web 应用程序。用户可以通过拖拽元素（如文本、按钮、表格等）来设计应用界面，构建数据库以及建立响应用户操作的工作流。Bubble 提供强大的数据库功能、实时预览、丰富的插件生态系统以及 AI 集成等特色功能，支持多种设备，能快速实现创意并发布应用。</p> <h2 style="font-size: 20px;">Bubble的官网地址</h2> <ul> <li>官网地址：https://bubble.io/</li> </ul>

MoonBit

<p>MoonBit 是粤港澳大湾区数字经济研究院（IDEA 研究院）基础软件中心推出的AI云原生开发平台，主要面向云和边缘计算场景。以 WebAssembly 为运行平台，支持函数式、面向对象、并行等多种编程范式，语法简洁且类似 Rust 和 Go，具备强类型系统和类型推断功能。MoonBit 的最大特点是编译速度快、运行性能高，原生后端在数值计算领域比 Java 快 15 倍，输出体积也远小于传统语言。支持 AI 原生开发，能通过安全机制确保代码生成的可靠性。</p> <h2 style="font-size: 20px;">MoonBit的官网地址</h2> <ul> <li>官网地址： <a href="https://www.moonbitlang.cn/" target="_blank" rel="noopener">https://www.moonbitlang.cn/</a> </li> </ul>

ThinkChain

<p>ThinkChain是开源框架，提升AI工具的智能交互能力。框架将工具的执行结果实时反馈到AI（如 Claude）的思考过程中，形成动态的反馈循环，让AI能调用工具，根据工具结果进行推理和决策。ThinkChain支持自动工具发现、MCP服务器扩展及增强的 CLI 界面，支持开发者用简单的Python文件扩展功能，实现从天气查询到数据库操作等多种应用。框架基于MIT许可证，鼓励开发者fork和扩展，为不同领域定制智能解决方案。</p> <h2 style="font-size: 20px;">ThinkChain的主要功能</h2> <ul> <li>工具结果实时反馈：将工具的执行结果实时注入到 AI 的思考过程中，形成动态反馈循环，让 AI 根据工具结果进行推理和决策。</li> <li>动态工具发现：自动发现 /tools 目录中的 Python 工具文件，无需手动注册或复杂配置。支持热重载，基于 /refresh 命令实时更新工具列表。</li> <li>支持 MCP 服务器：支持连接到外部的 MCP（Model Context Protocol）服务器，扩展工具功能，支持数据库操作、网页自动化等多种工具。</li> <li>增强的 CLI 界面：提供丰富的命令行界面，支持颜色、边框、进度条等功能，支持优雅降级到标准文本界面。</li> <li>交互式命令支持：提供多种斜杠命令（如 /tools、/refresh、/config），方便用户与 AI 交互、管理工具。</li> <li>灵活的工具开发：开发者用简单的 Python 类实现工具，支持自定义工具名称、描述、输入模式和执行逻辑。</li> <li>多模型支持：支持多种 Claude 模型，用户根据需求切换模型调整思考预算。</li> </ul> <h2 style="font-size: 20px;">ThinkChain的项目地址</h2> <ul> <li>项目官网： <a href="https://martinbowling.com/" target="_blank" rel="noopener">https://martinbowling.com/</a>. </li> <li>GitHub仓库：<a class="external" href="https://github.com/martinbowling/ThinkChain" target="_blank" rel="noopener nofollow">https://github.com/martinbowling/ThinkChain</a></li> </ul>

钉钉宜搭

<p>钉钉宜搭是阿里巴巴推出的低代码应用开发平台，帮助企业快速、高效地搭建数字化业务应用。通过可视化拖拽和配置的方式，让不懂代码的业务人员也能开发出符合自身需求的应用系统，降低了开发门槛和成本。用户可以用丰富的组件库，快速构建出各类业务表单，通过自定义流程规则实现高效的业务审批和流转。宜搭具备强大的数据统计和分析能力，能帮助企业更好地进行决策支持。</p> <h2 style="font-size: 20px;">钉钉宜搭的主要功能</h2> <ul> <li> <div class="paragraph">应用可视化搭建：提供大量图形化开发组件，用户通过拖拽和配置，无需代码或仅需少量代码能快速完成应用搭建，不懂代码的业务人员也可成为开发者。</div> </li> <li> <div class="paragraph">应用量身定制：通过表单、流程、数据能力搭建贴合业务需求的应用，实现业务数字化。</div> </li> <li> <div class="paragraph">集成云原生&amp;钉原生能力：打通阿里云和钉钉底层能力，连接企业原有系统与钉钉，降低数字化门槛。</div> </li> <li> <div class="paragraph">表单设计：提供丰富表单组件，用户可拖拽组件到画布完成表单设计，用于数据收集和记录。</div> </li> <li> <div class="paragraph">流程设计：结合表单和工作流程，可自定义审批规则、流程规则等，简化应用系统搭建，让业务处理更高效。</div> </li> <li> <div class="paragraph">报表功能：可对表单收集数据进行统计分析，提供多种展示功能，方便决策人员进行趋势分析和决策制定。</div> </li> <li> <div class="paragraph">数据处理：具备强大的数据处理能力，能高效地对表单收集的数据进行处理。</div> </li> <li> <div class="paragraph">国际化能力：支持Outlook及Gmail邮箱，审批记录支持多语言。</div> </li> <li> <div class="paragraph">AI集成：上线「钉钉Agent」插件，支持将钉钉智能助理集成到宜搭表单应用中。</div> </li> </ul> <h2 style="font-size: 20px;">如何使用钉钉宜搭</h2> <ul> <li>官方网站： <a href="https://www.aliwork.com/" target="_blank" rel="noopener">https://www.aliwork.com/</a> </li> </ul>

通义灵码

<p># 核心亮点</p> <ul class="list-paddingleft-1"> <li> <p>支持最强开源模型千问3，其代码能力达到业界领先水平，同时支持MCP协议，具备强大的工具调用能力，可以帮助开发者快速开发智能体应用。</p> </li> <li> <p>全面集成通义灵码智能编码助手（即通义灵码插件）的能力，无需安装插件开箱即用，直接体验高效、智能的编程体验。</p> </li> <li> <p>自带编程智能体模式，开发者只需描述编码任务，通义灵码便可以自主地进行工程感知、代码检索、执行终端、调用MCP工具等，端到端地帮助开发者完成编码任务。</p> </li> <li> <p>全面支持长期记忆、行间建议预测（NES - Next Edit Suggestion）、行间会话（Inline Chat）等能力，为开发者带来更丝滑、更智能的编程体验。</p> </li> </ul> <p># 功能介绍</p> <p>// 编程智能体模式</p> <p>通义灵码智能体模式具备自主决策、环境感知、工具使用等能力，可以根据开发者的编码诉求，使用工程检索、文件编辑、终端等工具，端到端地完成编码任务。同时，支持开发者配置MCP工具，拓宽了AI编码助手能力边界，更加贴合开发者工作流程。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/06/01/1748821175_uIzGK6wYIt.png"></p> <p>// MCP工具使用</p> <p>通义灵码深度集成国内最大的MCP中文社区——魔搭MCP广场，涵盖开发者工具、文件系统、搜索、地图等十大热门领域3000+ MCP服务，全面拓宽AI 编码助手能力边界，更加贴合开发者工作流程。</p> <p>例如，在通义灵码上调用高德MCP，无需编写代码，10分钟定制一个出游攻略网页，还能将生成的旅行攻略导入高德地图APP，快速创建专属地图，满足在行程中进行探店、导航、打车及购票等出行需求。</p> <p>// 长期记忆能力</p> <p>通义灵码首创了自动记忆功能，可以逐渐形成对开发者编程习惯、对话历史、工程等相关的丰富记忆，并自动进行记忆整理，提升编程效率和编程体验。</p> <p>// Nes行间预测能力</p> <p>通义灵码上线的行间建议预测功能，能帮助开发者基于当前代码修改，动态预测出下一个代码修改建议，开发者只需按Tab键，即可高效完成代码编写，无论在新功能开发、存量工程维护、复杂项目迭代等场景，通义灵码都能结合工程感知能力，预测当前代码文件及跨文件的修改建议，快速完成工程内的代码修改。</p> <p>// lnline chat行间对话能力</p> <p>行间会话（Inline Chat）支持开发者在代码编辑器区域进行对话，开发者可以通过自然语言对话的方式进行单个文件内的代码修改或进行即时提问。</p>

Macaly

<p>Macaly 是创新的无代码应用开发工具，通过自然语言处理技术，让用户能将想法转化为可运行的应用程序。可以通过简单的文字描述或语音指令，直接参与到应用的创建和修改过程中。Macaly 能实时反馈视觉效果，让用户即时看到更改结果，极大地提高了开发效率和协作体验。Macaly 与 GitHub 深度集成，支持无缝的代码管理和协作，包括拉取、推送和问题管理。</p> <p><img src="https://img.medsci.cn/aisite/img//gp3IhrCPeNYlWrKjfekPKdQPbnyrnxwoHVZu9Z1g.png"></p> <h2 style="font-size: 20px;">Macaly的主要功能</h2> <ul> <li>自然语言生成应用：Macaly 支持用户通过自然语言描述来创建应用程序和网站，用户只需输入想法，Macaly 会即时生成应用。</li> <li>与 GitHub 无缝集成：通过 GitHub App，用户可以将现有的 GitHub 项目直接导入 Macaly。</li> <li>实时结果与即时反馈：用户在工作时可以看到即时的视觉反馈，无需等待代码编译或部署。</li> <li>AI 开发伙伴：Macaly 可以自动解决 GitHub 问题并创建拉取请求，提高开发效率。</li> <li>适应现有代码库：增强现有项目或从零开始构建，Macaly 能轻松应对。</li> <li>支持多环境部署：用户可以在开发、测试和生产等多个环境中部署应用，确保应用的稳定性和可扩展性。</li> </ul> <h2 style="font-size: 20px;">Macaly的官网地址</h2> <ul> <li>官网地址：<a href="https://www.macaly.com/">macaly.com</a></li> </ul>

CoreAgent

<p>CoreAgent是网易智企推出的企业级智能体开发协作平台。支持问答、工作流、自主智能体等多种形态的智能体开发、测评和托管。平台采用RAG技术构建知识库，具备高性能检索和高召回效果。自主智能体支持云原生架构的沙箱运行机制，提供安全隔离和资源可控的运行环境，可通过MCP协议调度第三方服务。检测用户输入和生成内容，确保合规。通过多种连接器和智能组件，CoreAgent可与网易CodeWave无缝打通，助力企业快速落地智能应用。</p> <h2 style="font-size: 20px;">CoreAgent的主要功能</h2> <ul> <li>自主智能体：根据任务要求，自主生成最优行动策略，调用多种工具，完成任务落地。</li> <li>丰富AI工具和MCP工具：标准化接口，敏捷接入丰富AI工具，多工具协同编排。</li> <li>多形态智能体开发：支持问答、工作流、自主智能体等多种形态的智能体开发。</li> <li>快速落地应用：企业可基于此平台快速落地如智能客服助手、智能电销教练、智能数据分析、智能供应链等智能化工具。</li> </ul> <h2 style="font-size: 20px;">CoreAgent的技术原理</h2> <ul> <li>知识库能力：知识库采用RAG技术，基于网易云商和七鱼多年算法技术积累，达到高性能的检索和业内领先的召回效果。</li> <li>沙箱运行机制：自主智能体支持基于网易云信云原生架构的沙箱运行机制，提供安全隔离、资源可控的智能体运行环境，同时支持通过MCP协议调度其他第三方服务。</li> <li>内容安全保障：智能体的内容安全由网易易盾安全专家保驾护航，提供大模型和智能体的安全围栏，检测用户输入和生成内容，识别是否存在各类违规风险，全面保障内容合规。</li> <li>无缝连接能力：通过多种连接器和智能组件，CoreAgent平台开发出的智能体服务可以与网易CodeWave无缝打通，助力企业快速落地基于智能体的智能应用。</li> </ul> <h2 style="font-size: 20px;">CoreAgent的官方地址</h2> <ul> <li>官方地址： <a href="https://codewave.163.com/coreagent" target="_blank" rel="noopener">https://codewave.163.com/coreagent</a> </li> </ul>

Pocket Flow

<p>Pocket Flow 是极简的 LLM（大型语言模型）框架，仅用 100 行代码实现。具有轻量级、无依赖、无厂商锁定的特点。Pocket Flow支持多Agents、工作流、检索增强生成（RAG）等强大功能，帮助开发者快速构建基于 LLM 的应用程序。基于Agentic Coding范式，AI Agents协助开发，大幅提升开发效率。Pocket Flow 适合希望用极简方式开发 LLM 应用的开发者使用。</p> <h2 style="font-size: 20px;">Pocket Flow的主要特色</h2> <ul> <li>轻量级：核心图形抽象仅 100 行。零依赖，无厂商锁定。</li> <li>富有表现力：您喜欢的大型框架中的所有功能 — — （<a href="https://the-pocket.github.io/PocketFlow/design_pattern/multi_agent.html">多</a>）<a href="https://the-pocket.github.io/PocketFlow/design_pattern/agent.html">代理</a>、<a href="https://the-pocket.github.io/PocketFlow/design_pattern/workflow.html">工作流</a>、<a href="https://the-pocket.github.io/PocketFlow/design_pattern/rag.html">RAG</a>等等。</li> <li>Agentic-Coding：足够直观，AI代理可以帮助人类构建复杂的LLM应用程序。</li> </ul> <h2 style="font-size: 20px;">Pocket Flow的主要功能</h2> <ul> <li>多Agents支持：支持创建和管理多个Agent，每个Agent执行特定任务，例如搜索、对话、数据处理等。</li> <li>工作流管理：支持复杂的工作流设计，将多个任务按顺序或条件组合，实现自动化处理。</li> <li>检索增强生成（RAG）：结合检索和生成能力，基于检索相关数据增强生成内容的准确性和相关性。</li> <li>轻量级开发：仅需100行代码，无多余依赖，适合快速开发和部署。</li> <li>Agent 编程：支持Agentic Coding范式，AI Agent 协助开发者完成编码任务，提升开发效率。</li> <li>多种语言支持：提供Python、TypeScript、Java、C++和Go等多种语言版本，满足不同开发者的需求。</li> </ul> <h2 style="font-size: 20px;">Pocket Flow的技术原理</h2> <ul> <li>核心抽象图（Graph）：基于“图”的抽象。图结构用在表示任务之间的关系和数据流，基于节点和边定义任务的执行顺序和依赖关系。让复杂的工作流和多Agents协作能用简洁的方式实现。</li> <li>极简代码实现：基于精简代码，Pocket Flow 去除不必要的依赖和冗余功能，保留实现LLM框架核心功能的必要部分。让框架体积小、加载快，适合快速开发和部署。</li> <li>Agent协作：支持多Agent协作，Agent能独立运行，或基于消息传递或共享状态进行交互。</li> <li>无依赖和无供应商锁定：基于避免依赖外部库和框架，保证开发的灵活性和自主性。开发者根据自己的需求自由扩展和定制框架，不受特定供应商的限制。</li> </ul> <h2 style="font-size: 20px;">Pocket Flow的项目地址</h2> <ul> <li>项目官网：<a class="external" href="https://the-pocket.github.io/PocketFlow/?utm_source=medsci" target="_blank" rel="noopener">https://the-pocket.github.io/PocketFlow/</a></li> <li>GitHub仓库：<a class="external" href="https://github.com/The-Pocket/PocketFlow" target="_blank" rel="noopener nofollow">https://github.com/The-Pocket/PocketFlow</a></li> </ul>

Eko

<p>fellou开源智能体工作流框架，Eko 2.0 在不同复杂程度上始终表现优异：</p> <ul> <li>简单任务：成功率为 95%（其他产品的成功率为 80-90%）</li> <li>平均成功率：78%（其他产品成功率为 56-61%）</li> <li>中等复杂度：成功率为 76%（其他产品的成功率为 49-58%）</li> <li>困难任务：成功率为 70%（其他产品的成功率为 32-43%）</li> </ul> <p>这些数字背后隐藏着不可靠的自动化工具和企业真正可以依赖的生产就绪的 Agentic 工作流框架之间的关键区别。</p> <h3 id="multi-agent-collaboration-architecture">多代理协作架构</h3> <p>Eko 2.0 原生支持多智能体协作，在速度和功能上均有显著提升。在开发 Eko 2.0 的过程中，我们见证了智能体间通信协议的快速发展。很快，我们还将原生支持 A2A 功能，实现智能体之间的直接信息交换，进一步提升整个智能体工作流的智能水平和执行效率。</p> <p>这种多代理协作架构不仅提高了性能，更重要的是，它为复杂的业务场景提供了更灵活、更可靠的解决方案。</p> <h3 id="dynamic-planning-engine">动态计划引擎</h3> <p>Eko 1.0 采用单次计划。执行计划一旦制定，便无法灵活调整，这在面对复杂多变的现实场景时往往显得力不从心。Eko 2.0 的动态计划引擎彻底突破了这一限制。</p> <p>流规划与重新规划功能使 Eko 2.0 能够实时生成和调整执行计划。当工作流在执行过程中遇到意外情况（例如网页结构变更、API 响应异常或数据格式不匹配）时，系统不会简单地抛出错误并停止执行。相反，它会根据当前执行状态动态地重新规划后续步骤。这种自适应能力确保了工作流的连续性和可靠性，即使在不可预见的情况下也能从容地处理和恢复。</p> <p>动态LLM配置进一步提升了系统的智能化水平。Eko 2.0可以根据具体任务需求，在运行时动态调整语言模型参数，甚至在不同的执行阶段切换不同的模型配置。这种智能的资源配置不仅优化了性能，还显著提升了成本效益。</p> <h3 id="reactive-execution-control">反应式执行控制</h3> <p>在 Eko 1.0 中，我们通过 Hook 系统为开发者提供了工作流的可观察性和干预能力——工作流钩子、子任务钩子和工具钩子支持在关键点进行监控和调整。虽然这种设计在静态环境中表现良好，但现代 Web 应用程序越来越依赖动态内容和异步加载，这带来了传统钩子机制通常难以有效应对的挑战。</p> <p>Eko 2.0 的反应式执行控制系统基于 Hook 系统的核心原理，并针对动态 Web 环境的挑战进行了重新设计。我们已经从被动的“钩子监听”发展到主动的“事件响应”，使代理能够真正“理解”并适应不断变化的 Web 环境。</p> <p>DOM 事件监控和循环任务功能使 Eko 2.0 能够实时感知网页变化。与 Eko 1.0 依赖预设挂钩点不同，新系统可以主动监控 DOM 变化、用户交互以及 JavaScript 生成的动态元素。这意味着代理不再需要依赖固定的等待时间或重复的轮询，而是可以智能地响应实际的页面变化，从而显著提高 Web 自动化的效率和可靠性。</p> <p>高级回调系统是对原有 Hook 系统的全面升级。在保留工作流钩子、子任务钩子等核心功能的同时，引入了流回调、人工回调和回调链等高级功能。流回调能够实时监控工作流执行状态，人工回调在关键决策点引入人工干预机制，而回调链功能则将这些功能串联起来，构建比传统 Hook 系统更复杂、更灵活的事件处理工作流。</p> <p>这种从“静态钩子”到“反应式执行控制”的演进，不仅增强了系统对动态环境的适应性，更重要的是为开发者提供了前所未有的控制粒度和灵活性。</p> <h3 id="extensible-tools-framework">可扩展工具框架</h3> <p>可扩展性是构建生产级 Agentic Workflow 框架不可或缺的功能。Eko 2.0 现已支持 MCP 集成，使开发人员能够自由高效地集成第三方工具和服务。</p> <p>此外，自定义工具扩展功能进一步释放了框架的潜力。开发者不再局限于预设的工具集合，而是可以根据特定的业务需求构建专门的工具模块。Eko 2.0 提供了简洁而强大的工具开发接口。开发者可以轻松地将自己的工具封装成与 Eko 兼容的模块，并与整个工作流系统无缝集成。</p> <p>这种开放灵活的工具架构设计，保证了Eko 2.0的能力边界不断扩展，为各行各业的自动化需求提供日益丰富的解决方案，使得Eko Framework具备持续的可扩展性。</p> <h2 id="architecture-reimagined-built-for-scale-speed-and-capability">重新构想的架构：为规模、速度和功能而构建</h2> <p>Eko 2.0 的架构代表了围绕三个核心原则构建的重大架构改进：规模、速度和能力。</p> <p>规模扩展：Eko 2.0 从单智能体架构演进至支持多智能体协作系统，通过专业化的分工，使复杂任务能够得到更高效的处理。通过 MCP 协议集成，该框架获得了几乎无限的工具集成能力，使开发者能够轻松扩展功能边界。即将推出的 A2A（Agent-to-Agent）通信功能将进一步增强多智能体之间的协同，构建真正智能的协作网络。</p> <p>速度优化：Eko 2.0 通过优化执行流程、减少冗余操作，实现了 1.2 倍的性能提升，显著提升了整体执行效率。智能资源调度机制使系统能够根据具体任务需求动态选择最优的 LLM 模型配置，在保证质量的同时进一步优化性能。</p> <p>能力提升：Eko 2.0 在智能决策方面实现了质的飞跃，从简单的指令执行进化为具备智能判断和环境自适应能力的系统。动态重新规划功能使框架能够优雅地处理异常和意外变化，80% 的基准测试成功率则展现了其强大的处理复杂现实场景的能力。先进的回调系统支持细粒度的人为干预和监管，流规划与实时 DOM 事件监控相结合，确保工作流能够精准响应动态变化的 Web 环境。</p> <h2 id="eko-20-vs-the-competition-a-clear-advantage">Eko 2.0 与竞争对手相比：明显的优势</h2> <p> </p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/img//3pnzHqiqKEdZAXFbI8mowAyWGNwQlMrW4plHfh7x.png"></p> <p>其他框架受限于特定环境或需要复杂的配置，而 Eko 2.0 则实现了通用平台支持和自然语言工作流生成的完美结合——这在当前市场上其他框架中是独一无二的。跨平台兼容性和自然语言工作流生成的集成，使 Eko 2.0 真正兑现了其对易用、强大自动化的承诺。对于既需要强大功能又需要开发便捷性的团队来说，Eko 2.0 是理想的解决方案。</p> <p> </p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/23/1748029080_NVc0MTruNX.webp"></p> <p>基于这些基础，Eko 2.0 的架构实现了重大升级，从用户入手，通过 Web、Node.js 和浏览器扩展环境连接到核心规划代理系统。该系统集成了意图检测、DOM 监听和计时器功能，同时保持与高级 LLM 模型的双向通信。该框架建立了一个完整的记忆系统，实现了“思考与观察”和“自我反思”功能，同时部署了专用的计算机、文件和浏览器代理，共享强大的工具池资源，包括变量存储、任务状态管理和事件触发器。</p> <p>地址： <a href="https://github.com/FellouAI/eko?utm_source=medsci" target="_blank" rel="noopener">https://github.com/FellouAI/eko</a> </p> <p> 网址：<a href="https://fellou.ai/eko/?utm_source=medsci" target="_blank" rel="noopener">https://fellou.ai/eko/</a> </p>

分类导航