超级麦吉是一个强大的通用型 AI Agent,专门面向复杂任务场景设计。通过多 Agent 设计体系以及丰富的工具能力支持,超级麦吉支持自主任务理解、自主任务规划、自主行动、自主纠错等智能的能力。它能够理解自然语言指令,执行各类业务流程,并交付最终的目标结果。作为麦吉产品矩阵的旗舰产品,超级麦吉通过开源的方式提供了强大的二次开发能力,让企业能够快速构建和部署符合特定业务需求的智能助手,大幅提升决策效率和决策质量。

下图是一个由超级麦吉完全自主完成的复杂任务,我们在官网也准备了丰富的案例,你可以访问 https://www.letsmagic.cn 打开你对超级麦吉的想象力。

对于超级麦吉,我们不仅开放了官方智能体定义,还将支持用户通过自然语言的方式创造属于自己的智能体,并通过输入 @ 轻松连接成千上万个工具或 MCP 服务,真正地帮助你做到会打字就能打造你自己的超级智能体!

Github: https://github.com/dtyq/magic   
Gitee: https://gitee.com/letsmagic/magic

神奇流程 Magic Flow

神奇流程是一个强大的可视化 AI 流程编排系统,让用户能够自由地在画布上构建复杂的 AI Agent 工作流。它具有以下核心特点:

  • 可视化编排:直观的拖拽式界面,无需编写代码即可设计复杂的 AI 工作流程,通过节点连接轻松实现各种功能组合。
  • 丰富的原子节点与工具库:内置多种预设工具,包括文本处理、图像生成、代码运行等,满足多样化的业务需求。
  • 知识库检索:强大的混合检索增强生成功能,支持各种格式文档的检索和语义理解,确保 AI 回答基于企业知识库真实知识。
  • 全面的模型支持:兼容主流大模型服务商 API 协议,可灵活选择适合业务场景的大模型。
  • 自定义扩展:支持自定义工具节点开发,满足特定业务场景的专属需求。
  • 系统集成能力:支持与 Magic IM 及其他第三方 IM 系统(企业微信、钉钉、飞书)无缝对接,实现跨平台协作。
  • 实时调试监控:提供完善的调试和监控功能,帮助快速识别和解决工作流中的问题,确保 AI 应用稳定运行。

麦吉即时通讯 Magic IM

麦吉即时通讯系统是一个企业级的即时通讯系统,它提供了丰富的人与人、人与 AI Agent 的对话能力,支持多轮对话、上下文理解、知识库检索等功能,让企业能够快速构建智能客服、知识助手等应用。

麦吉即时通讯系统具有以下核心特点:

  • 深度 AI 整合:提供强大的自定义消息卡片机制与表单设计器,支持通过 AI Agent 智能生成多样化复杂表单,高效完成各种业务流程。
  • 单聊能力:支持组织成员之间的对话以及人与 AI Agent 的深度交流,确保高效工作沟通的同时也可与无数 AI Agent 深度探讨各类难题。
  • 群聊能力:强大的群组聊天功能,支持多人实时协作讨论,AI 智能参与群聊并提供即时解答,促进团队高效沟通与知识共享。
  • 对话管理:完善的对话管理,支持通过话题来区分不同的对话内容,在支持与 AI Agent 对话的同时也支持与组织内的人对话。
  • 企业级架构:支持在离线消息、多设备在线、已读、撤回、重新编辑、正在输入等特性,支持万人千部门,千人群聊天下的高可靠消息收发。
  • 多组织与多环境支持:支持多组织部署和严格的组织数据隔离,并且可以一站式连接多个不同云环境服务。

相关推荐

天工超级智能体Skywork Super Agents

天工超级智能体Skywork Super Agents

<p>昆仑万维面向全球市场,同步发布天工超级智能体(Skywork Super Agents)。这款产品采用了AI agent架构和deep research技术,能够一站式生成文档、PPT、表格(excel)、网页、播客和音视频多模态内容。它具有强大的deep research能力,在GAIA榜单上排名全球第一,超过了OpenAI Deep Research和Manus。</p> <p>天工超级智能体(Skywork Super Agents)的问世,代表中国向全世界隆重宣告:传统的Office类软件已被颠覆,“AI Office智能体”时代已然到来!</p> <div id="page-content"> <div id="js_mpvedio_wrapper_wxv_3997128950315925505"> <div class="feed-wrapper"> <div class="infinity-list__wrapper"> <div class=""> <div class="infinity-list__page destory-enter-to" data-key="wxv_3997128950315925505"> <div class="mp-video-player" data-v-bff4f6b6=""> <div id="js_mpvedio_1747890732687_1447502487379" class="js_mpvedio page_video_wrapper" data-v-e0d91df3="" data-v-bff4f6b6=""></div> </div> </div> </div> </div> </div> </div> </div> <p>-全球官网: <a href="https://skywork.ai" target="_blank" rel="noopener">https://skywork.ai</a>  </p> <p><br>-中国官网: <a href="https://tiangong.cn" target="_blank" rel="noopener">https://tiangong.cn</a> </p> <p>01、5种模态,一键生成,用8分钟完成8小时的工作</p> <p>作为职场办公人士,你一定会有这样的体验:我们60%的办公时间都被复杂的材料撰写所占据。我们疲于完成各种各样的调研报告、汇报总结、数据表格、演示文稿,在无数个“不改版”、“最终不改版”、“绝对不改版”中苦苦逡巡。我们经历了无数个披星戴月、挑灯夜战的时刻,却没有时间去创造真正的价值。</p> <p>而今天,这样的日子就此终结了!因为有了“AI Office智能体”的先驱——天工超级智能体(Skywork Super Agents)。这款产品提供了5个专家级agents和1个通用agent,能大大提升专业级内容的生成效率和质量,把你真正敢用、拿来就能用的精品内容直接送到你眼前!</p> <p>与Manus这样的拥有广泛功能但缺乏专业深度的AI智能体不同,天工超级智能体(Skywork Super Agents)构建了一个由「5个专家智能体」 + 「1个通用智能体」组成的垂直专业系统:</p> <p>5个专家智能体,分别专注于专业文档(doc)、PPT、表格(excel)、播客和网页的生成:其中,文档、PPT、表格是办公人群最常用的需求,也是Microsoft Office、Google Workspace的核心功能,通常被称作“Office三件套”。</p> <p>天工(Skywork)在这三个智能体里,集成了媲美OpenAI Deep Research的deep research能力,能够提供专家级、咨询级、科研级的内容生成结果。而网页、播客则是新媒体时代有趣也有意义的内容模态。5个专家级agents,都致力于针对办公、学习场景的真实用例,量身定制高质量内容。</p> <p>1个通用智能体,接入了数十个MCP,包括能够熟练地处理多模态创意任务,用于生成诸如图片、海报、音乐、MV、宣传片、有声读物、绘本和其他多媒体内容。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/22/1747890853_lZ3tbTdOc3.gif"></p> <p>基于此,天工超级智能体(Skywork Super Agents)让各行各业的用户能够制作可信、可编辑和即用型内容,将AI的角色从助手转变为真正的生产力伙伴!</p> <p>02、Deep Research+“Office三件套”:天工(Skywork)行走江湖的独门秘笈</p> <p>此次发布的核心,是天工超级智能体(Skywork Super Agents)的「文档」、「PPT」和「表格」三大智能体。</p> <p>首先来说「文档」。如今,用户的写作需求愈发多元化和专业化,像行业研究、竞品调研、产品规划、学术论文、商业计划、市场推广、创意写作,都是较为高频的需求。这些需求不仅横跨商业、学术、营销等多个领域,更对内容的专业性、创新性与实用性提出了极高要求。</p> <p>为了满足这些需求,天工(Skywork)在它的「文档」智能体里集成了deep research能力。我们自研了deep research模型,提供基于模型深度思考和推理能力的信息检索,增加搜索的广度和宽度,以及信息检索效率。通过强化学习增加模型search能力的泛化性,为用户生成内容提供高质量的源信息。天工(Skywork)能够提供媲美OpenAI的deep research能力,同时成本只有openAI的40%。</p> <p>天工(Skywork)的deep research agent框架在Meta和Huggingface联合推出的GAIA的评测集上取得了82.42的高分,超越了OpenAI Deep Research和Manus,位居第一(2025年5月10日数据)。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/22/1747890853_U2yqIUsMVa.png"></p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/22/1747890853_ksTBY57u1P.jpeg"></p> <p>在OpenAI推出的agent评测任务SimpleQA上,Skywork也取得了94.5分,超越了当前的SOTA。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/22/1747890853_CO6hpN4A2o.png"></p> <p>相比OpenAI的Deep Research,天工(Skywork)的「文档」智能体所生成的研究报告,具备更多的数据图表。条形图、直方图、折线图、饼状图、雷达图、数据表格……用天工(Skywork)的document agent生成的报告里,能生动美观地呈现这些图表。</p>

Agent Neo

Agent Neo

<p>flowith 团队推出了其最新的 AI 智能体产品Agent Neo。是世界首个可以支持无限步骤・无限上下文・无限工具的 AI Agent。</p> <p>据称,Agent Neo 具备处理无限工作流步骤的能力,支持长时间云端执行,并拥有嵌套代理层级结构。用户还可以通过其知识市场将专业知识变现。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/21/1747778356_80T4oqqeAd.png"></p> <p> </p> <p>官方演示展示了通过单一提示生成完整游戏设计文档的案例,并强调其能够处理超过 1000 个逻辑步骤,7x24 小时运行且不丢失上下文。</p> <p>在公布的基准测试中,flowith Neo 在 GAIA 基准测试中超越了 OpenAI Deep Research、Manus 两款热门 Agent。</p> <p>体验上,flowith Neo 会根据任务进程实时更新 planner,支持定时、延期任务,可 7×24h 工作,可执行长达一周、一个月的任务。同时,flowith Neo 输入 / 输出长度可无限。Flowith 认为,支持无限上下文是 Agent 进化为 AGI 的必经之路。</p> <p>网址:<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fflowith.io%2Fblank" target="_blank" rel="noopener">https://flowith.io</a></p>

AgenticSeek

AgenticSeek

<p>类似 Manus 但基于 Deepseek R1 Agents 的本地模型。</p> <p>Manus AI 的本地替代品,它是一个具有语音功能的大语言模型秘书,可以 Coding、访问你的电脑文件、浏览网页,并自动修正错误与反省,最重要的是不会向云端传送任何资料。采用 DeepSeek R1 等推理模型构建,完全在本地硬体上运行,进而保证资料的隐私。</p> <div> <h2 style="font-size: 20px;">Features:</h2> </div> <ul> <li>100% 本机运行: 本机运行,不使用云端服务,所以资料绝不会散布出去,我的东西还是我的!不会被当作其他服务的训练资料。</li> <li>文件的交互系统: 使用 bash 去浏览本机资料和操作本机系统。</li> <li>自主 Coding: AgenticSeek 可以自己运行、Debug、编译 Python、C、Golang 和各种语言。</li> <li>代理助理: 不同的工作由不同的助理去处理问题。AgenticSeek 会自己寻找最适合的助理去做相对应的工作。</li> <li>规划: 对于复杂的任务,AgenticSeek 会交办给不同的助理进行规划和执行。</li> <li>自主学习: 自动在网路上寻找资料。</li> <li>记忆功能: 对于每次的对话进行统整、保存对话,并且在本地储存用户的使用习惯。</li> </ul> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">为什么选择 AgenticSeek?</h3> <a id="user-content-为什么选择-agenticseek" class="anchor" href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#%E4%B8%BA%E4%BB%80%E4%B9%88%E9%80%89%E6%8B%A9-agenticseek" aria-label="Permalink: 为什么选择 AgenticSeek?"></a></div> <ul dir="auto"> <li> <p>🔒 完全本地化与隐私保护 - 所有功能都在您的设备上运行 — 无云端服务,无数据共享。您的文件、对话和搜索始终保持私密。</p> </li> <li> <p>🌐 智能网页浏览 - AgenticSeek 能够自主浏览互联网 — 搜索、阅读、提取信息、填写网页表单 — 全程无需人工操作。</p> </li> <li> <p>💻 自主编码助手 - 需要代码?它可以编写、调试并运行 Python、C、Go、Java 等多种语言的程序 — 全程无需监督。</p> </li> <li> <p>🧠 智能代理选择 - 您提问,它会自动选择最适合该任务的代理。就像拥有一个随时待命的专家团队。</p> </li> <li> <p>📋 规划与执行复杂任务 - 从旅行规划到复杂项目 — 它能将大型任务分解为步骤,并利用多个 AI 代理完成工作。</p> </li> <li> <p>🎙️ 语音功能 - 清晰、快速、未来感十足的语音与语音转文本功能,让您能像科幻电影中一样与您的个人 AI 助手对话。</p> </li> </ul> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/20/1747721962_Lr470yGYSB.png"></p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">安装</h2> <a id="user-content-安装" class="anchor" href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#%E5%AE%89%E8%A3%85" aria-label="Permalink: 安装"></a></div> <p>确保已安装了 Chrome driver,Docker 和 Python 3.10(或更新)。</p> <p>我们强烈建议您使用 Python 3.10 进行设置,否则可能会发生依赖错误。</p> <p>有关于 Chrome driver 的问题,请参见 Chromedriver 部分。</p> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">1️⃣ 复制储存库与设置环境变数</h3> <a id="user-content-1️⃣-复制储存库与设置环境变数" class="anchor" href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#1%EF%B8%8F%E2%83%A3-%E5%A4%8D%E5%88%B6%E5%82%A8%E5%AD%98%E5%BA%93%E4%B8%8E%E8%AE%BE%E7%BD%AE%E7%8E%AF%E5%A2%83%E5%8F%98%E6%95%B0" aria-label="Permalink: 1️⃣ 复制储存库与设置环境变数"></a></div> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>git clone https://github.com/Fosowl/agenticSeek.git cd agenticSeek mv .env.example .env</pre> <div class="zeroclipboard-container"> </div> </div> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">2️ 建立虚拟环境</h3> <a id="user-content-2️-建立虚拟环境" class="anchor" href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#2%EF%B8%8F-%E5%BB%BA%E7%AB%8B%E8%99%9A%E6%8B%9F%E7%8E%AF%E5%A2%83" aria-label="Permalink: 2️ 建立虚拟环境"></a></div> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>python3 -m venv agentic_seek_env source agentic_seek_env/bin/activate # On Windows: agentic_seek_env\Scripts\activate</pre> <div class="zeroclipboard-container"> </div> </div> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">3️⃣ 安装所需套件</h3> <a id="user-content-3️⃣-安装所需套件" class="anchor" href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#3%EF%B8%8F%E2%83%A3-%E5%AE%89%E8%A3%85%E6%89%80%E9%9C%80%E5%A5%97%E4%BB%B6" aria-label="Permalink: 3️⃣ 安装所需套件"></a></div> <p>自动安装:</p> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>./install.sh</pre> <div class="zeroclipboard-container"> </div> </div> <p>** 若要让文本转语音(TTS)功能支持中文,你需要安装 jieba(中文分词库)和 cn2an(中文数字转换库):**</p> <div class="snippet-clipboard-content notranslate position-relative overflow-auto"> <pre class="notranslate"><code>pip3 install jieba cn2an </code></pre> <div class="zeroclipboard-container"> </div> </div> <p>手动安装:</p> <p>注意:对于任何操作系统,请确保您安装的 ChromeDriver 与您已安装的 Chrome 版本匹配。运行 <code>google-chrome --version</code>。如果您的 Chrome 版本 > 135,请参阅已知问题</p> <ul dir="auto"> <li>Linux:</li> </ul> <p>更新软件包列表:<code>sudo apt update</code></p> <p>安装依赖项:<code>sudo apt install -y alsa-utils portaudio19-dev python3-pyaudio libgtk-3-dev libnotify-dev libgconf-2-4 libnss3 libxss1</code></p> <p>安装与您的 Chrome 浏览器版本匹配的 ChromeDriver: <code>sudo apt install -y chromium-chromedriver</code></p> <p>安装 requirements:<code>pip3 install -r requirements.txt</code></p> <ul dir="auto"> <li>Macos:</li> </ul> <p>更新 brew:<code>brew update</code></p> <p>安装 chromedriver:<code>brew install --cask chromedriver</code></p> <p>安装 portaudio:<code>brew install portaudio</code></p> <p>升级 pip:<code>python3 -m pip install --upgrade pip</code></p> <p>升级 wheel:<code>pip3 install --upgrade setuptools wheel</code></p> <p>安装 requirements:<code>pip3 install -r requirements.txt</code></p> <ul dir="auto"> <li>Windows:</li> </ul> <p>安装 pyreadline3:<code>pip install pyreadline3</code></p> <p>手动安装 portaudio(例如,通过 vcpkg 或预编译的二进制文件),然后运行:<code>pip install pyaudio</code></p> <p>从以下网址手动下载并安装 chromedriver:<a href="https://sites.google.com/chromium.org/driver/getting-started" rel="nofollow">https://sites.google.com/chromium.org/driver/getting-started</a></p> <p>将 chromedriver 放置在包含在您的 PATH 中的目录中。</p> <p>安装 requirements:<code>pip3 install -r requirements.txt</code></p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">在本地机器上运行 AgenticSeek</h2> <a id="user-content-在本地机器上运行-agenticseek" class="anchor" href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#%E5%9C%A8%E6%9C%AC%E5%9C%B0%E6%9C%BA%E5%99%A8%E4%B8%8A%E8%BF%90%E8%A1%8C-agenticseek" aria-label="Permalink: 在本地机器上运行 AgenticSeek"></a></div> <p>建议至少使用 Deepseek 14B 以上参数的模型,较小的模型难以使用助理功能并且很快就会忘记上下文之间的关系。</p> <p>本地运行助手</p> <p>启动你的本地提供者,例如使用 ollama:</p> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>ollama serve</pre> <div class="zeroclipboard-container"> </div> </div> <p>请参阅下方支持的本地提供者列表。</p> <p>更新 config.ini</p> <p>修改 config.ini 文件以设置 provider_name 为支持的提供者,并将 provider_model 设置为该提供者支持的 LLM。我们推荐使用具有推理能力的模型,如 Qwen 或 Deepseek。</p> <p>请参见 README 末尾的 FAQ 部分了解所需硬件。</p> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>[MAIN] is_local = True # 无论是在本地运行还是使用远程提供者。 provider_name = ollama # 或 lm-studio, openai 等.. provider_model = deepseek-r1:14b # 选择适合您硬件的模型 provider_server_address = 127.0.0.1:11434 agent_name = Jarvis # 您的 AI 助手的名称 recover_last_session = True # 是否恢复之前的会话 save_session = True # 是否记住当前会话 speak = True # 文本转语音 listen = False # 语音转文本,仅适用于命令行界面 work_dir = /Users/mlg/Documents/workspace # AgenticSeek 的工作空间。 jarvis_personality = False # 是否使用更"贾维斯"风格的性格,不推荐在小型模型上使用 languages = en zh # 语言列表,文本转语音将默认使用列表中的第一种语言 [BROWSER] headless_browser = True # 是否使用无头浏览器,只有在使用网页界面时才推荐使用。 stealth_mode = True # 使用无法检测的 selenium 来减少浏览器检测</pre> <div class="zeroclipboard-container"> </div> </div> <p>警告:使用 LM-studio 运行 LLM 时,请不要将 provider_name 设置为 <code>openai</code>。请将其设置为 <code>lm-studio</code>。</p> <p>注意:某些提供者(如 lm-studio)需要在 IP 前面加上 <code>http://</code>。例如 <code>http://127.0.0.1:1234</code></p> <p>本地提供者列表</p> <table> <thead> <tr> <th>提供者</th> <th>本地?</th> <th>描述</th> </tr> </thead> <tbody> <tr> <td>ollama</td> <td>是</td> <td>使用 ollama 作为 LLM 提供者,轻松本地运行 LLM</td> </tr> <tr> <td>lm-studio</td> <td>是</td> <td>使用 LM Studio 本地运行 LLM(将 <code>provider_name</code> 设置为 <code>lm-studio</code>)</td> </tr> <tr> <td>openai</td> <td>否</td> <td>使用兼容的 API</td> </tr> </tbody> </table> <p>下一步: <a href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#Start-services-and-Run">Start services and run AgenticSeek</a></p> <hr> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">Run with an API (透过 API 执行)</h2> <a id="user-content-run-with-an-api-透过-api-执行" class="anchor" href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#run-with-an-api-%E9%80%8F%E8%BF%87-api-%E6%89%A7%E8%A1%8C" aria-label="Permalink: Run with an API (透过 API 执行)"></a></div> <p>设定 <code>config.ini</code>。</p> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>[MAIN] is_local = False provider_name = openai provider_model = gpt-4o provider_server_address = 127.0.0.1:5000</pre> <div class="zeroclipboard-container"> </div> </div> <p>警告:确保 <code>config.ini</code> 没有行尾空格。</p> <p>如果使用基于本机的 openai-based api 则把 <code>is_local</code> 设定为 <code>True</code>。</p> <p>同时更改你的 IP 为 openai-based api 的 IP。</p> <p>下一步: <a href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#Start-services-and-Run">Start services and run AgenticSeek</a></p> <hr> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">Start services and Run</h2> <a id="user-content-start-services-and-run" class="anchor" href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#start-services-and-run" aria-label="Permalink: Start services and Run"></a></div> <p>(启动服务并运行)</p> <p>如果需要,请激活你的 Python 环境。</p> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>source agentic_seek_env/bin/activate</pre> <div class="zeroclipboard-container"> </div> </div> <p>启动所需的服务。这将启动 <code>docker-compose.yml</code> 中的所有服务,包括:</p> <ul dir="auto"> <li>searxng</li> <li>redis(由 redis 提供支持)</li> <li>前端</li> </ul> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>sudo ./start_services.sh # MacOS start ./start_services.cmd # Windows</pre> <div class="zeroclipboard-container"> </div> </div> <p>选项 1: 使用 CLI 界面运行。</p> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>python3 cli.py</pre> <div class="zeroclipboard-container"> </div> </div> <p>选项 2: 使用 Web 界面运行。</p> <p>注意:目前我們建議您使用 CLI 界面。Web 界面仍在積極開發中。</p> <p>启动后端服务。</p> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>python3 api.py</pre> <div class="zeroclipboard-container"> </div> </div> <p>访问 <code>http://localhost:3000/</code>,你应该会看到 Web 界面。</p> <p>请注意,目前 Web 界面不支持消息流式传输。</p> <p>如果你不知道如何开始,请参阅 Usage 部分</p> <hr> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">Usage (使用方法)</h2> <a id="user-content-usage-使用方法" class="anchor" href="https://github.com/Fosowl/agenticSeek/blob/main/README_CHS.md#usage-%E4%BD%BF%E7%94%A8%E6%96%B9%E6%B3%95" aria-label="Permalink: Usage (使用方法)"></a></div> <p>为确保 agenticSeek 在中文环境下正常工作,请确保在 config.ini 中设置语言选项。 languages = en zh 更多信息请参阅 Config 部分</p> <p>确定所有的核心档案都启用了,也就是执行过这条命令 <code>./start_services.sh</code> 然后你就可以使用 <code>python3 cli.py</code> 来启动 AgenticSeek 了!</p> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>sudo ./start_services.sh python3 cli.py</pre> <div class="zeroclipboard-container"> </div> </div> <p>当你看到执行后显示 <code>>>> </code> 这表示一切运作正常,AgenticSeek 正在等待你给他任何指令。 你也可以透过设定 <code>config.ini</code> 内的 <code>listen = True</code> 来启用语音转文字。</p> <p>要退出时,只要和他说 <code>goodbye</code> 就可以退出!</p>

WebThinker

WebThinker

<p>WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(LRMs)在推理过程中自主进行网络搜索、网页导航和报告撰写。WebThinker基于深度网页探索器和自主思考、搜索、写作策略,让LRMs能动态获取信息,实时生成高质量研究报告。WebThinker基于强化学习的训练策略进一步优化工具使用效率。WebThinker在复杂推理和报告生成任务中表现优异,显著提升LRMs在知识密集型任务中的可靠性和实用性。</p> <h2 style="font-size: 20px;">WebThinker的主要功能</h2> <ul> <li>自主决策:LRM在推理过程中自主判断何时需要外部知识,何时需要更新报告。</li> <li>深度探索:支持进行多步搜索和页面导航,深入挖掘信息。</li> <li>动态撰写:模型能实时撰写、修改报告内容,配备专门的工具集(如写作、检查、编辑),确保报告的连贯性和完整性。</li> <li>工具优化:优化LRM对研究工具的使用效率。</li> </ul> <h2 style="font-size: 20px;">WebThinker的技术原理</h2> <ul> <li>深度网页探索器(Deep Web Explorer):赋予LRM超越传统简单搜索的能力,基于点击链接和按钮等交互元素在网页间导航,深入挖掘信息。模型自主决定搜索查询,持续探索直至收集到足够信息,返回精炼总结。</li> <li>基于强化学习的训练策略:基于迭代式的在线直接偏好优化(DPO)训练,提升LRM对研究工具(包括搜索、导航、报告撰写工具)的利用效率。构建偏好数据集,优先选择能得出正确答案、高质量报告且工具使用更高效的推理路径。</li> <li>运行模式:问题解决模式为LRM配备深度网页探索器,深入探索网络解决复杂问题。报告生成模式进一步赋予LRM写作、检查和编辑能力,在思考和搜索的同时,迭代式地撰写全面的研究报告。</li> </ul> <h2 style="font-size: 20px;">WebThinker的项目地址</h2> <ul> <li>项目官网:<a class="external" href="https://foremost-beechnut-8ed.notion.site/WebThinker-Empowering-Large-Reasoning-Models-with-Deep-Research-Capability-d13158a27d924a4b9df7f9ab94066b64?utm_source=medsci" target="_blank" rel="noopener">https://foremost-beechnut-8ed.notion.site/WebThinker</a></li> <li>GitHub仓库:<a class="external" href="https://github.com/RUC-NLPIR/WebThinker" target="_blank" rel="noopener nofollow">https://github.com/RUC-NLPIR/WebThinker</a></li> <li>HuggingFace模型库:<a class="external" href="https://huggingface.co/collections/lixiaoxi45/webthinker-6812d5fd1287ee53d68f0557" target="_blank" rel="noopener nofollow">https://huggingface.co/collections/lixiaoxi45/webthinker</a></li> <li>arXiv技术论文:<a class="external" href="https://arxiv.org/pdf/2504.21776" target="_blank" rel="noopener nofollow">https://arxiv.org/pdf/2504.21776</a></li> </ul>

Co-Sight

Co-Sight

<p>Co-Sight是中兴通讯开源的超级智能体项目,为协同视觉分析平台及智能自动化底座。采用多智能体架构,构建“数字团队”协同体系,通过DAG任务引擎驱动,实现任务的高效调度与执行。Co-Sight具备自我进化能力,能通过执行记录与模型推理自动生成智能总结报告,形成持续改进闭环。注重安全与可靠性,所有操作在沙箱环境中运行,支持日志追溯、权限管控与合规审计。</p> <h2 style="font-size: 20px;">Co-Sight的主要功能</h2> <ul> <li>智能总结与反思:基于执行过程记录与模型推理,能自动进行复盘,生成智能总结报告,内容包括成功关键点复盘、失败原因定位、优化建议反馈等,形成持续自我进化闭环。</li> <li>多重安全防护:所有操作在受控沙箱环境中进行,防止数据越界或泄露;系统日志实时记录,操作路径全程可追溯;支持权限管控与合规审计,保障企业运营安全无忧。</li> <li>实时监控与智能识别:能实时分析监控视频,快速识别异常行为,通过深度学习技术,准确识别多种行为和对象。</li> <li>灵活部署:支持多种操作系统和硬件平台,易于部署和扩展。</li> </ul> <h2 style="font-size: 20px;">Co-Sight的技术原理</h2> <ul> <li>多智能体架构:Co-Sight采用多智能体(Multi-Agent)架构,构建了“数字团队”协同体系。主管智能体统筹调度多个执行智能体,各司其职,协同完成复杂任务。使系统具备出色的任务拆解与流程协同能力,能动态重规划与自适应容错,在任务执行过程中自动应对突发情况,灵活调整策略,确保流程连续稳定。</li> <li>DAG任务引擎:Co-Sight引入DAG(有向无环图)任务调度机制,智能识别任务中的并发节点,结合多智能体的并发执行能力,显著缩短整体流程周期。提供的丰富工具组件,涵盖多种搜索引擎、语音与图像识别工具、文档处理工具等,能一站式完成从规划到执行的各项任务。</li> <li>深度学习与自然语言处理:Co-Sight融合了深度学习模型和自然语言处理(NLP)技术,基于大规模的神经网络进行推理和决策。系统能处理海量的图像数据、文本信息以及多元的传感器数据</li> </ul> <h2 style="font-size: 20px;">Co-Sight的项目地址</h2> <ul> <li>Github仓库:<a class="external" href="https://github.com/ZTE-AICloud/Co-Sight" target="_blank" rel="noopener nofollow">https://github.com/ZTE-AICloud/Co-Sight</a></li> </ul> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">🛠安装指南</h2> <a id="user-content-installation-guide" class="anchor" href="https://github.com/ZTE-AICloud/Co-Sight#installation-guide" aria-label="永久链接:🛠安装指南"></a></div> <ol dir="auto"> <li> <p>下载项目:您可以选择以下方式下载项目到本地:</p> <p>1. 使用 Git clone 访问<a href="https://github.com/ZTE-AICloud/Co-Sight">https://github.com/ZTE-AICloud/Co-Sight</a>,点击绿色的 'Code' 按钮,</p> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre># 1. Select HTTP protocol git clone https://github.com/ZTE-AICloud/Co-Sight.git # 2. Select SSH git clone git@github.com:ZTE-AICloud/Co-Sight.git cd Co-Sight</pre> <div class="zeroclipboard-container"> </div> </div> <p>2.下载zip文件 访问<a href="https://github.com/ZTE-AICloud/Co-Sight">https://github.com/ZTE-AICloud/Co-Sight</a>,点击绿色 'Code' 按钮,选择 'Download ZIP',下载后解压进入项目目录。</p> </li> <li> <p>准备环境:python版本>=3.11</p> </li> <li> <p>安装依赖项:在项目目录下运行以下命令安装依赖项:</p> </li> </ol> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>pip install -r requirements.txt</pre> <div class="zeroclipboard-container"> </div> </div> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">⚙️配置</h2> <a id="user-content-️configuration" class="anchor" href="https://github.com/ZTE-AICloud/Co-Sight#%EF%B8%8Fconfiguration" aria-label="永久链接:⚙️配置"></a></div> <ol dir="auto"> <li>复制模板<code>.env_template</code>并生成<code>.env</code>(文档已加入<code>.gitignore</code>,安全存储隐私信息):</li> <li>编辑 <code>.env</code> 配置核心参数: <ol dir="auto"> <li>大模型配置:配置对应的大模型地址、模型名称、API-KEY等,并进一步(可选)配置规划、执行、工具、多模态模型;</li> <li>搜索引擎配置(可选):配置相关搜索引擎的API-KEY; <ol dir="auto"> <li>Google搜索申请方法:<a href="https://developers.google.com/custom-search/v1/overview?hl=zh-cn#api_key" rel="nofollow">https://developers.google.com/custom-search/v1/overview?hl=zh-cn#api_key</a> <a href="https://github.com/ZTE-AICloud/Co-Sight/blob/master/assets/Pasted_image_20250916105315.png" target="_blank" rel="noopener noreferrer"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://github.com/ZTE-AICloud/Co-Sight/raw/master/assets/Pasted_image_20250916105315.png"></a></li> <li>Tavily Search 申请方式:<a href="https://app.tavily.com/home" rel="nofollow">https://app.tavily.com/home</a> <a href="https://github.com/ZTE-AICloud/Co-Sight/blob/master/assets/Pasted_image_20250502115315.png" target="_blank" rel="noopener noreferrer"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://github.com/ZTE-AICloud/Co-Sight/raw/master/assets/Pasted_image_20250502115315.png"></a></li> </ol> </li> </ol> </li> </ol> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">▶️快速入门</h2> <a id="user-content-️-quick-start" class="anchor" href="https://github.com/ZTE-AICloud/Co-Sight#%EF%B8%8F-quick-start" aria-label="永久链接:▶️ 快速入门"></a></div> <ol dir="auto"> <li>启动服务:cosight_server/deep_research/main.py <a href="https://github.com/ZTE-AICloud/Co-Sight/blob/master/assets/Pasted_image_20250430225822.png" target="_blank" rel="noopener noreferrer"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://github.com/ZTE-AICloud/Co-Sight/raw/master/assets/Pasted_image_20250430225822.png"></a></li> <li>打开浏览器并访问 <code>http://localhost:7788/cosight/</code></li> <li>在输入框中输入您的第一个任务,体验智能研究引擎的强大功能!</li> </ol>

OpenManus

OpenManus

超级智能体,平替Manus

Simular AI

Simular AI

Agent S2:一个开放、模块化、可扩展的计算机使用智能体框架

agent.exe

agent.exe

我想看看 Claude 新的计算机API 有多好用,但他们提供的默认项目感觉太过笨重。这是一个简单的 Electron 应用,可以让 Claude 3.5 Sonnet 直接控制你的本地计算机。我原本计划添加一个“半自动”模式,让用户在执行每个操作之前确认,但每个步骤都太慢了,我觉得这完全没必要。如果模型出现问题,你只需点击“停止”按钮即可结束运行。

orence潮汐AI

orence潮汐AI

潮汐AIGC问答系统,聚合多模态大模型、知识库、插件和工作流等 Agent 构建能力,致力于为用户提供 LLM 大语言模型落地应用的强大在线平台。 新版本采用 Gin + Vite5 TypeScript Vue3 技术栈,拥有极致的响应速度;在更简洁的界面下保留完整功能,拥有更多的细节但是更加轻量化,拥有新的UI及交互方式,内置6组不同风格的显示效果,以及更流畅的使用体验。 AI对话:(OPENAI、讯飞星火、百度文心、智谱清言、通义千问、腾讯混元、Kimi全系列模型)以及更多自定义模型如deepseek、claude、bing、llama3、gemini、stable-diffusion、suno-v3、DALL-E3等兼容OPENAI API的模型; AI绘画:DALL-E3 Midjourney Flux; AI写作:思维导图、小应用助手、写作、PDF对话; AIPPT:对话式创作演示文稿; WorkFlow:一站式AI智能体搭建平台,支持AI Agent智能对话机器人; 插件:支持联网搜索丨文件问答丨 URL解析丨图像识别丨HTML代码运行等; 支付:支付宝、微信、易支付 登录:邮箱、短信验证、QQ、微信 客户端:Android iOS Windows MacOS支持

Thinkeo

Thinkeo

Thinkeo 提供了一个可定制的 AI 平台,利用多个 AI 智能体协同工作来创建复杂的文档。这些智能体通过从各种来源收集信息来管理整个文档创建过程。然后,它们生成结构化的报告或文档。 Thinkeo 适用于市场分析或技术摘要等任务。它还能处理复杂的行政和监管文书工作。该系统能够理解特定的合规规则和框架,确保资金申请等文件符合要求。Thinkeo 致力于确保输出结果的一致性和准确性。 它使用多个 AI智能体协作创建文档。 自动化从数据收集到最终输出的整个工作流程。 处理来自不同来源的数据以生成全面的报告。 处理需要合规性的复杂行政文件。

AgentLed AI

AgentLed AI

AgentLed AI 使用协作代理实现无需编码的工作流自动化。它具有“执行智能体”功能,用于监督业务运营。这些代理会分析数据,为决策提供依据并提出改进建议。用户可以使用简单的英语命令构建自动化序列。 代理一旦设置完成即可自主运行,设定月度目标并执行相关任务。该系统包含持续学习功能,可随着时间的推移不断完善策略。AgentLed AI 致力于提高整体业务效率和增长,帮助企业从 AI 试验走向更广泛的应用。 使用简单的英语指令构建 AI 驱动的工作流。 具有执行智能体功能,用于运营监督和分析。 智能体可以自主设定目标、执行任务并进行学习。 创建集成到业务流程中的多步骤工作流。

Globus AI

Globus AI

Globus AI 专注于劳动力管理自动化。其 AI 代理有助于人才参与和职位安排。代理会自动读取并排序空缺职位,从而减少招聘经理的手动数据处理。Globus AI 能够快速将候选人与合适的职位匹配。 它采用自由文本分析,而非复杂的关键词系统。Globus AI 可以简化面试安排和职位安排的流程。人才可以通过简单的浏览器界面访问和接受职位。每次互动都有助于 AI 改进未来的匹配效果,最终目标是提高职位安排效率和员工满意度。 自动读取、排序空缺职位并确定其优先级。 使用文本分析快速将候选人与职位匹配。 简化经理和人才的排班和协调工作。 利用互动数据优化未来的推荐。

CortexON AI

CortexON AI

CortexON AI 是一款开源 AI 智能体。它旨在思考并自动化常见任务,与许多商业方案不同,其代码公开可用。这种方法强调数据的透明度和用户控制。用户可以查看代理的工作原理并进行修改。 CortexON 专注于执行自主决策。它可以满足不同领域的不同自动化需求。其重点在于确保每个人都能轻松访问并适应,同时企业保留对其信息的完全所有权。 提供对其代码库的完全访问权限,以实现透明度。 能够独立决策和任务自动化。 确保用户掌控自己的数据隐私。 公开构建,欢迎社区提出想法和贡献。

Supervity AI

Supervity AI

Supervity AI 提供一套旨在提升业务效率的智能体。该平台作为公司知识的中心枢纽,根据内部文档提供精准的答案。智能体可以连接上千种不同的软件应用程序,管理涉及多个步骤的工作流程,从而实现现有业务系统的自动化。 用户无需编写代码即可构建自动化流程。名为“协同浏览 AI”的功能可实时指导员工使用软件,同时另一位智能体可以安全自然地处理客户对话。Vision AI 智能代理通过查看图像和视频来获取洞察,财务部门则利用它们来加快发票处理速度。 集中公司知识,快速获得参考答案。 管理跨多个软件平台的复杂任务。 提供数字化工具采用的实时指导。 分析可视化数据以发现模式或问题。

Suna

Suna

Suna 是一款完全开源的 AI 助手,可帮助您轻松完成实际任务。通过自然对话,Suna 将成为您进行研究、数据分析和应对日常挑战的数字伙伴——它结合了强大的功能和直观的界面,能够理解您的需求并为您提供帮助。 Suna 强大的工具包包括:无缝的浏览器自动化功能(用于网页导航和数据提取)、文件管理功能(用于文档创建和编辑)、网页爬取和扩展搜索功能、命令行执行系统任务、网站部署以及与各种 API 和服务的集成。这些功能协同工作,使 Suna 能够通过简单的对话解决您的复杂问题并实现工作流程自动化!

UFO²

UFO²

微软开放的桌面智能体,The Desktop AgentOS.

xinxiang-心响

xinxiang-心响

心响是一个通用超级智能体,用户仅需一句话即可一键完成复杂任务。接收用户需求后,心响App能像「AI指挥官」一样下达命令,先将用户提出的复杂需求拆解成一系列子任务,然后通过自主规划与多智能体协作,调度多个领域智能体、使用多种工具解决问题,确保任务分解到位、执行有力,最终交付与用户需求契合的成果。 无论是在例行任务、智慧图表、深度研究、法律咨询等工作场景上,还是在摸鱼游戏、试题讲解、城市旅游、AI相亲、健康咨询等生活场景上,心响App都能高效满足用户的多样化需求,还提供了图文、视频、PDF文件、交互式网页应用等多种交付形态。它不仅集成了搜索、网页浏览、代码执行器、网页部署等工具,还能自主学习,不断提升产品效果与交付体验,让用户从复杂任务中得到解放,轻松“坐享其成”。

STORM and Co-Storm

STORM and Co-Storm

斯坦福大学在AI辅助学术研究领域取得了重大进展,他们的开源工具STORM进化后新增了协作对话机制Co-STORM。这一先进功能使得AI实体能够参与圆桌讨论,模拟人类般的互动。Co-STORM通过整合多个AI专家和一个主持人,在几分钟内生成关于特定主题的深入、经过充分研究的文章,同时具备跟踪和参与对话的能力,通过动态思维导图展示。该工具生成具有多元视角的详细报告,并且可在线免费获取,对研究人员和学生来说是一项值得关注的发展。 Co-STORM框架及其对学术研究的影响已被EMNLP 2024主要会议认可,突显了其对学术写作和信息发现未来的潜在影响。- 斯坦福大学推出了一款名为STORM的工具,利用大语言模型(LLM)辅助编写类维基百科文章。 - STORM可以将输入的主题转换为长篇文章或研究论文,并以PDF格式下载。 - STORM通过检索、多角度提问和模拟专家对话等方式生成写作大纲和内容报告。 - STORM擅长需要大量研究和引用的写作任务。 - STORM的GitHub上的Star量已经超过了24k。 - STORM团队推出了全新功能Co-STORM,引入了协作对话机制和轮次管理策略。 - Co-STORM包括Co-STORM LLM专家、主持人和人类用户。 - Co-STORM模拟用户、观点引导专家和主持人之间的协作对话。 - Co-STORM的评估结果表明其在报告质量和对话质量方面优于基线模型。 - Co-STORM的主持人角色可以根据未使用信息提出问题,帮助用户发现更多信息。 - Co-STORM可以帮助用户找到与目标相关的更广泛、更深层次的信息。 STORM 认为研究过程自动化的核心是自动提出好的问题。直接提示语言模型提出问题效果并不好。为了提高问题的深度和广度,STORM 采用了两种策略: 观点引导提问:给定输入主题,STORM 通过调查类似主题的现有文章来发现不同的观点,并使用它们来控制提问过程。 模拟对话:STORM 模拟维基百科作者和基于互联网资源的主题专家之间的对话,使语言模型能够更新其对主题的理解并提出后续问题。 斯坦福又推出了STORM的升级版 ——Co-STORM,引入了协作对话机制,并采用轮次管理策略,实现了AI 智能体间的圆桌讨论和流畅的协作式 AI 学术研究。