STORM and Co-Storm

斯坦福大学 AI辅助学术研究开源工具协作对话思维导图维基百科圆桌讨论智能体

斯坦福大学在AI辅助学术研究领域取得了重大进展，他们的开源工具STORM进化后新增了协作对话机制Co-STORM。这一先进功能使得AI实体能够参与圆桌讨论，模拟人类般的互动。Co-STORM通过整合多个AI专家和一个主持人，在几分钟内生成关于特定主题的深入、经过充分研究的文章，同时具备跟踪和参与对话的能力，通过动态思维导图展示。该工具生成具有多元视角的详细报告，并且可在线免费获取，对研究人员和学生来说是一项值得关注的发展。 Co-STORM框架及其对学术研究的影响已被EMNLP 2024主要会议认可，突显了其对学术写作和信息发现未来的潜在影响。- 斯坦福大学推出了一款名为STORM的工具，利用大语言模型（LLM）辅助编写类维基百科文章。 - STORM可以将输入的主题转换为长篇文章或研究论文，并以PDF格式下载。 - STORM通过检索、多角度提问和模拟专家对话等方式生成写作大纲和内容报告。 - STORM擅长需要大量研究和引用的写作任务。 - STORM的GitHub上的Star量已经超过了24k。 - STORM团队推出了全新功能Co-STORM，引入了协作对话机制和轮次管理策略。 - Co-STORM包括Co-STORM LLM专家、主持人和人类用户。 - Co-STORM模拟用户、观点引导专家和主持人之间的协作对话。 - Co-STORM的评估结果表明其在报告质量和对话质量方面优于基线模型。 - Co-STORM的主持人角色可以根据未使用信息提出问题，帮助用户发现更多信息。 - Co-STORM可以帮助用户找到与目标相关的更广泛、更深层次的信息。 STORM 认为研究过程自动化的核心是自动提出好的问题。直接提示语言模型提出问题效果并不好。为了提高问题的深度和广度，STORM 采用了两种策略：观点引导提问：给定输入主题，STORM 通过调查类似主题的现有文章来发现不同的观点，并使用它们来控制提问过程。模拟对话：STORM 模拟维基百科作者和基于互联网资源的主题专家之间的对话，使语言模型能够更新其对主题的理解并提出后续问题。斯坦福又推出了STORM的升级版 ——Co-STORM，引入了协作对话机制，并采用轮次管理策略，实现了AI 智能体间的圆桌讨论和流畅的协作式 AI 学术研究。

相关推荐

FinGenius

<p>FinGenius 是全球首个A股AI金融博弈智能体应用。FinGenius基于多Agent博弈架构，模拟市场参与者行为，用16个超级智能体（如舆情、游资、风控等）分工协作，快速生成精准的金融分析报告。FinGenius 引入博弈论优化决策，结合“年轮记忆规则算法”记录用户投资习惯，提供个性化分析。FinGenius 支持用AI重塑金融分析，提升决策效率，为投资者和金融机构提供创新解决方案。</p> <h2 style="font-size: 20px;">FinGenius 的主要功能</h2> <ul> <li>多Agent博弈系统：多个专业智能体（如舆情、游资、风控等）分工协作，从不同角度分析市场数据，生成综合报告。模拟市场参与者互动，优化决策过程，预测市场走势。</li> <li>深度数据整合与报告生成：整合多种数据源，快速生成结构化多模态报告，提炼关键信息和风险点。</li> <li>实时数据处理：毫秒级处理海量金融数据，实时监控市场异常，提前识别潜在风险。</li> <li> <div class="paragraph">风险预警系统：实时监控市场异常，提前识别潜在风险，为金融分析提供安全保障。</div> </li> <li>MCP智能调用与工具集成：基于 Model Context Protocol (MCP)，实现模型间无缝协作，支持即插即用的金融工具生态。</li> </ul> <h2 style="font-size: 20px;">FinGenius的官网地址</h2> <ul> <li>官网地址： <a href="http://fingenius.cn/" target="_blank" rel="noopener">http://fingenius.cn/</a> </li> <li>GitHub仓库： <a href="https://github.com/HuaYaoAI/FinGenius" target="_blank" rel="noopener">https://github.com/HuaYaoAI/FinGenius</a> </li> </ul>

JoyAgent-JDGenie

<div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">业界首个开源高完成度轻量化通用多智能体产品(JoyAgent-JDGenie)</h2> <a id="user-content-业界首个开源高完成度轻量化通用多智能体产品joyagent-jdgenie" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E4%B8%9A%E7%95%8C%E9%A6%96%E4%B8%AA%E5%BC%80%E6%BA%90%E9%AB%98%E5%AE%8C%E6%88%90%E5%BA%A6%E8%BD%BB%E9%87%8F%E5%8C%96%E9%80%9A%E7%94%A8%E5%A4%9A%E6%99%BA%E8%83%BD%E4%BD%93%E4%BA%A7%E5%93%81joyagent-jdgenie" aria-label="Permalink: 业界首个开源高完成度轻量化通用多智能体产品(JoyAgent-JDGenie)"></a></div> <p>解决快速构建多智能体产品的最后一公里问题</p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">简介</h2> <a id="user-content-简介" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E7%AE%80%E4%BB%8B" aria-label="Permalink: 简介"></a></div> <p>当前相关开源agent主要是SDK或者框架，用户还需基于此做进一步的开发，无法直接做到开箱即用。我们开源的JoyAgent-JDGenie是端到端的多Agent产品，对于输入的query或者任务，可以直接回答或者解决。例如用户query"给我做一个最近美元和黄金的走势分析"，JoyAgent-Genie可以直接给出网页版或者PPT版的报告文档。</p> <p>JoyAgent-JDGenie是一个通用的多智能体框架，对于用户需要定制的一些新场景功能，只需将相关的子智能体或者工具挂载到JoyAgent-Genie即可。为了验证JoyAgent-JDGenie的通用性，在GAIA榜单准确率达到75.15%，已超越OWL（CAMEL）、Smolagent（Huggingface）、LRC-Huawei（Huawei）、xManus（OpenManus）、AutoAgent（香港大学）等行业知名产品。</p> <p>此外，我们的开源多智能体产品JoyAgent-JDGenie相对比较轻量，不像阿里的SpringAI-Alibaba需要依赖阿里云百炼平台相关功能（基于百炼平台调用LLM），Coze依赖火山引擎平台。</p> <p>我们整体开源了智能体产品JoyAgent-JDGenie，包括前端、后端、框架、引擎、核心子智能体（报告生成智能体、代码智能体、PPT智能体、文件智能体等）、想用微调后效果更好的欢迎使用JoyAgent。</p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">产品对比</h2> <a id="user-content-产品对比" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E4%BA%A7%E5%93%81%E5%AF%B9%E6%AF%94" aria-label="Permalink: 产品对比"></a></div> <table> <thead> <tr> <th>分类</th> <th>agent</th> <th>是否开源</th> <th>是否开源完整产品</th> <th>是否依赖生态</th> </tr> </thead> <tbody> <tr> <td rowspan="2">SDK类</td> <td>SpringAI-Alibaba</td> <td>部分</td> <td>否，只开源SDK（SDK）</td> <td>是（阿里云百炼平台）</td> </tr> <tr> <td>Coze</td> <td>部分</td> <td>否，只开源部分Nieo SDK（SDK）</td> <td>是（火山引擎平台）</td> </tr> <tr> <td rowspan="6">框架类</td> <td>Fellow</td> <td>是</td> <td>否，只开源了Eko智能体框架（框架）</td> <td>否</td> </tr> <tr> <td>Dify</td> <td>是</td> <td>否，只开源了智能体框架，且主要是workflow（框架）</td> <td>否</td> </tr> <tr> <td>SkyworkAI</td> <td>是</td> <td>否，只开源了智能体框架（框架）</td> <td>否</td> </tr> <tr> <td>OpenManus</td> <td>是</td> <td>否，只开源了智能体框架（框架）</td> <td>否</td> </tr> <tr> <td>Owl</td> <td>是</td> <td>否，只开源了智能体框架（框架）</td> <td>否</td> </tr> <tr> <td>n8n</td> <td>是</td> <td>否，只开源了智能体框架，且主要是workflow（框架）</td> <td>否</td> </tr> <tr> <td rowspan="3">协议类</td> <td>MCP</td> <td>是</td> <td>否，只是开源协议</td> <td>否</td> </tr> <tr> <td>A2A</td> <td>是</td> <td>否，只是开源协议</td> <td>否</td> </tr> <tr> <td>AG-UI</td> <td>是</td> <td>否，只是开源协议</td> <td>否</td> </tr> <tr> <td rowspan="2">技术模块类</td> <td>memory0</td> <td>是</td> <td>否，只是开源的技术模块</td> <td>否</td> </tr> <tr> <td>LlamaIndex</td> <td>是</td> <td>否，只是开源的技术模块</td> <td>否</td> </tr> <tr> <td>产品类</td> <td>Our</td> <td>是</td> <td>是，开源端到端完整的Agent产品（产品）</td> <td>否</td> </tr> </tbody> </table> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">框架效果先进性</h2> <a id="user-content-框架效果先进性" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E6%A1%86%E6%9E%B6%E6%95%88%E6%9E%9C%E5%85%88%E8%BF%9B%E6%80%A7" aria-label="Permalink: 框架效果先进性"></a></div> <table> <thead> <tr> <th>Agent</th> <th>Score</th> <th>Score_level1</th> <th>Score_level2</th> <th>Score_level3</th> <th>机构</th> </tr> </thead> <tbody> <tr> <td>Alita v2.1</td> <td>0.8727</td> <td>0.8868</td> <td>0.8953</td> <td>0.7692</td> <td>Princeton</td> </tr> <tr> <td>Skywork</td> <td>0.8242</td> <td>0.9245</td> <td>0.8372</td> <td>0.5769</td> <td>天工</td> </tr> <tr> <td>AWorld</td> <td>0.7758</td> <td>0.8868</td> <td>0.7791</td> <td>0.5385</td> <td>Ant Group</td> </tr> <tr> <td>Langfun</td> <td>0.7697</td> <td>0.8679</td> <td>0.7674</td> <td>0.5769</td> <td>DeepMind</td> </tr> <tr> <td>JoyAgent-JDGenie(Our)</td> <td>0.7515</td> <td>0.8679</td> <td>0.7791</td> <td>0.4230</td> <td>Our</td> </tr> <tr> <td>OWL</td> <td>0.6424</td> <td>0.7547</td> <td>0.6512</td> <td>0.3846</td> <td>CAMEL</td> </tr> <tr> <td>Smolagent</td> <td>0.5515</td> <td>0.6792</td> <td>0.5349</td> <td>0.3462</td> <td>Huggingface</td> </tr> <tr> <td>AutoAgent</td> <td>0.5515</td> <td>0.7170</td> <td>0.5349</td> <td>0.2692</td> <td>HKU</td> </tr> <tr> <td>Magentic</td> <td>0.4606</td> <td>0.5660</td> <td>0.4651</td> <td>0.2308</td> <td>MSR AI Frontiers</td> </tr> <tr> <td>LRC-Huawei</td> <td>0.406</td> <td>0.5283</td> <td>0.4302</td> <td>0.0769</td> <td>Huawei</td> </tr> <tr> <td>xManus</td> <td>0.4061</td> <td>0.8113</td> <td>0.2791</td> <td>0.0000</td> <td>OpenManus</td> </tr> </tbody> </table> <p><a href="https://github.com/jd-opensource/joyagent-jdgenie/blob/main/docs/img/score.png" target="_blank" rel="noopener noreferrer"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://github.com/jd-opensource/joyagent-jdgenie/raw/main/docs/img/score.png"></a></p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">系统架构</h2> <a id="user-content-系统架构" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E7%B3%BB%E7%BB%9F%E6%9E%B6%E6%9E%84" aria-label="Permalink: 系统架构"></a></div> <p><a href="https://github.com/jd-opensource/joyagent-jdgenie/blob/main/docs/img/archi.png" target="_blank" rel="noopener noreferrer"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://github.com/jd-opensource/joyagent-jdgenie/raw/main/docs/img/archi.png"></a></p> <p>本开源项目基于JoyAgent-JDGenie产品开源了整体的产品界面、智能体的多种核心模式（react模式、plan and executor模式等）、多个子智能体（report agent、search agent等）以及多整体间交互协议。</p> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">主要特点和优势</h3> <a id="user-content-主要特点和优势" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E4%B8%BB%E8%A6%81%E7%89%B9%E7%82%B9%E5%92%8C%E4%BC%98%E5%8A%BF" aria-label="Permalink: 主要特点和优势"></a></div> <ul dir="auto"> <li>端到端完整的多智能体产品，开箱即用，支持二次开发</li> <li>智能体框架协议 <ul dir="auto"> <li>支持多种智能体设计模式</li> <li>多智能体上下文管理</li> <li>高并发DAG执行引擎，极致的执行效率</li> </ul> </li> <li>子智能体和工具 <ul dir="auto"> <li>子Agent和工具可插拔：预制多种子智能体和工具</li> <li>多种文件交付样式：html、ppt、markdown</li> <li>plan和工具调用 RL优化迭代</li> <li>全链路流式输出</li> </ul> </li> </ul> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">主要创新点</h3> <a id="user-content-主要创新点" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E4%B8%BB%E8%A6%81%E5%88%9B%E6%96%B0%E7%82%B9" aria-label="Permalink: 主要创新点"></a></div> <p><a href="https://github.com/jd-opensource/joyagent-jdgenie/blob/main/docs/img/invo.png" target="_blank" rel="noopener noreferrer"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://github.com/jd-opensource/joyagent-jdgenie/raw/main/docs/img/invo.png"></a></p> <div class="markdown-heading" dir="auto"> <p>multi-level and multi-pattern thinking:结合多种智能体设计模式支持多层级的规划和思考</p> <a id="user-content-multi-level-and-multi-pattern-thinking结合多种智能体设计模式支持多层级的规划和思考" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#multi-level-and-multi-pattern-thinking%E7%BB%93%E5%90%88%E5%A4%9A%E7%A7%8D%E6%99%BA%E8%83%BD%E4%BD%93%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F%E6%94%AF%E6%8C%81%E5%A4%9A%E5%B1%82%E7%BA%A7%E7%9A%84%E8%A7%84%E5%88%92%E5%92%8C%E6%80%9D%E8%80%83" aria-label="Permalink: multi-level and multi-pattern thinking:结合多种智能体设计模式支持多层级的规划和思考"></a></div> <ul dir="auto"> <li>multi-level：work level 和 task level</li> <li>multi-pattern：plan and executor模式和react模式</li> </ul> <div class="markdown-heading" dir="auto"> <p>cross task workflow memory:跨任务级别的相似任务memory</p> <a id="user-content-cross-task-workflow-memory跨任务级别的相似任务memory" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#cross-task-workflow-memory%E8%B7%A8%E4%BB%BB%E5%8A%A1%E7%BA%A7%E5%88%AB%E7%9A%84%E7%9B%B8%E4%BC%BC%E4%BB%BB%E5%8A%A1memory" aria-label="Permalink: cross task workflow memory:跨任务级别的相似任务memory"></a></div> <div class="markdown-heading" dir="auto"> <p>tool evolution via auto-disassembly-and-reassembly of atom-tools</p> <a id="user-content-tool-evolution-via-auto-disassembly-and-reassembly-of-atom-tools" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#tool-evolution-via-auto-disassembly-and-reassembly-of-atom-tools" aria-label="Permalink: tool evolution via auto-disassembly-and-reassembly of atom-tools"></a></div> <ul dir="auto"> <li>基于已有工具迭代产生新工具，而不是从0-1直接生成新工具（减少错误工具的生成）</li> <li>基于已有工具隐性拆解为原子工具，并基于原子工具结合大模型自动组合成新工具（不需要花费人力预先定义和拆解原子工具）</li> </ul>

Magentic-UI

<p>这个工具不仅可以自动浏览网页、填写表单，还能执行代码、分析文件，关键是整个过程完全透明可控。</p> <h3 style="font-size: 18px;">主要功能</h3> <p>协同规划：通过对话和计划编辑器，与 AI 一起制定详细的任务执行步骤。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/07/17/1752698732_X5FoB00Ns1.png"></p> <p>协同任务执行：可以随时中断和引导任务执行，直接通过网页浏览器或对话进行干预。</p> <p>敏感操作保护：对于关键操作，系统会主动请求用户确认后再执行。</p> <p>计划学习和检索：从之前的运行中学习经验，改进未来的任务自动化，并保存到计划库中。</p> <p>并行任务处理：支持同时运行多个任务，状态指示器会提醒何时需要输入或任务完成。</p> <p>多模态交互：支持文本消息和图片附件，提供丰富的交互体验。</p>

Pokee AI

<p>Pokee AI 是下一代通用 AI Agent 开发平台。平台基于强化学习（RL）技术构建高效、个性化且交互性强的 AI Agent，替代传统大语言模型进行任务规划和工具调用。Pokee AI 的 Agent 在多步骤任务执行、推理和工具使用方面表现出色，能快速响应用户指令、提供精准服务，适用于电商、开发与创作、企业自动化等多个领域，基于个性化服务与用户建立长期绑定关系，推动 AI 在更多场景中的落地应用。</p> <h2 style="font-size: 20px;">Pokee AI的官网地址</h2> <ul> <li>官网地址：<a class="external" href="https://pokee.ai/?utm_source=ai-bot.cn" target="_blank" rel="noopener nofollow">pokee.ai</a></li> </ul>

NativeMind

<p>NativeMind是开源的完全在本地设备运行的AI助手。NativeMind支持DeepSeek、Qwen、Llama等多种模型，基于Ollama集成能无缝加载和切换。NativeMind功能包括智能对话、网页内容分析、翻译、写作辅助等，均在浏览器内完成，无需云同步。NativeMind确保数据100%本地处理，无云依赖，无追踪，无日志，让用户完全掌控自己的数据。</p> <h2 style="font-size: 20px;">NativeMind的主要功能</h2> <ul> <li>智能对话：具备多标签页上下文感知能力，进行全面的AI对话，能理解并整合不同页面的信息，让对话更连贯、深入。</li> <li>智能内容分析：能即时总结网页内容，快速提取关键信息；支持理解文档内容，帮助用户快速把握核心要点，节省阅读时间。</li> <li>通用翻译：提供全页翻译功能，支持双语并排显示，方便对比查看；支持对选定文本进行翻译，满足不同翻译需求。</li> <li>AI驱动搜索：增强浏览器的搜索能力，直接在浏览器中输入问题，NativeMind自动浏览网页给出精准答案，提升搜索效率。</li> <li>写作增强：自动检测文本，提供智能改写、校对和创意建议，帮助用户优化写作内容，提高写作质量。</li> <li>实时辅助：在浏览网页时，根据上下文动态显示浮动工具栏，提供相关功能按钮，如翻译、总结等，方便用户随时使用。</li> </ul> <h2 style="font-size: 20px;">NativeMind的项目地址</h2> <ul> <li>项目官网： <a href="https://nativemind.app/" target="_blank" rel="noopener">https://nativemind.app/</a> </li> <li>GitHub仓库： <a href="https://github.com/NativeMindBrowser/NativeMindExtension" target="_blank" rel="noopener">https://github.com/NativeMindBrowser/NativeMindExtension</a> </li> </ul>

Agent Zero

<p>Agent Zero 是开源的、动态的、可扩展的人工智能框架，成为用户个性化的智能助手。不是预设功能的工具，通过用户的指令和任务动态学习和成长。Agent Zero 具备持久记忆功能，能记住之前的解决方案、代码和事实，以便更快地解决未来任务。将计算机操作系统视为完成任务的工具，可以编写代码并使用终端执行任务，支持多代理协作，能创建下属代理以分解和解决复杂任务。Agent Zero 的行为完全由用户定义的系统提示控制，用户可以通过修改提示文件来定制其行为和功能。支持语音输入和输出，提供实时交互的 Web 界面，用户可以在任何时刻干预代理的行为。</p> <h2 style="font-size: 20px;">Agent Zero的地址</h2> <ul> <li>官网： <a href="https://agent-zero.ai/" target="_blank" rel="noopener">https://agent-zero.ai/</a> </li> <li>Github仓库： <a href="https://github.com/frdel/agent-zero" target="_blank" rel="noopener">https://github.com/frdel/agent-zero</a> </li> </ul>

飞书Aily

<p>飞书Aily是飞书推出的企业级Agent平台，类似于企业版的Manus。飞书Aily能深度调用公司内部知识库、任务系统和项目进度，并运行MCP，是真正意义上的企业级智能助手。平台解决了通用Agent无法进入企业内部的问题，因为企业数据安全至关重要，且企业数据大多存储在飞书的云文档、多维表格等系统中。Aily能接入飞书专属MCP，如飞书云文档、飞书项目、飞书任务等，满足企业个性化需求，提升工作效率。</p> <p>飞书Aily官网：https://aily.feishu.cn/</p>

WebSailor

<p>WebSailor 是阿里通义实验室开源的网络智能体，专注于复杂信息检索与推理任务。通过创新的数据合成方法（如 SailorFog-QA）和训练技术（如拒绝采样微调和 DUPO 算法），在高难度任务中表现出色，在 BrowseComp 等评测中超越多个知名模型，登顶开源网络智能体榜单。WebSailor 的推理重构技术能高效处理复杂任务，生成简洁且精准的推理链。在复杂场景中表现出色，在简单任务中展现出强大的泛化能力。</p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">WebSailor 的功能</h2> <a id="user-content-️-features-for-websailor" class="anchor" href="https://github.com/Alibaba-NLP/WebAgent?tab=readme-ov-file#%EF%B8%8F-features-for-websailor" aria-label="永久链接：⛵️ WebSailor 的功能"></a></div> <ul dir="auto"> <li>完整的后训练方法使模型能够进行扩展思考和信息搜索，最终使它们能够成功完成以前被认为无法解决的极其复杂的任务。</li> <li>推出SailorFog-QA，这是一个可扩展的 QA 基准测试，具有较高的不确定性和难度，采用新颖的数据合成方法，通过图形采样和信息混淆进行管理。SailorFog-QA 数据示例可在以下位置找到：<a href="https://github.com/Alibaba-NLP/WebAgent/blob/main/WebSailor/dataset/sailorfog-QA.jsonl"><code>WebSailor/dataset/sailorfog-QA.jsonl</code></a></li> <li>有效的训练后流程包括：（1）从专家轨迹中高质量地重建简洁推理，以进行清晰的监督；（2）一个两阶段的训练过程，涉及 RFT 冷启动阶段，然后是重复采样策略优化 (DUPO)，这是一种高效的代理 RL 算法，在有效性和效率方面表现出色。</li> <li>WebSailor-72B 的表现明显优于所有开源代理和框架，同时缩小了与领先专有系统的性能差距，在 BrowseComp-en 上获得了12.0%的得分，在 BrowseComp-zh 上获得了30.1%的得分，在 GAIA 上获得了55.4% 的得分。</li> <li>检查站很快就到了。</li> </ul> <h2 style="font-size: 20px;">WebSailor的项目地址</h2> <ul> <li>Github仓库： <a href="https://github.com/Alibaba-NLP/WebAgent" target="_blank" rel="noopener">https://github.com/Alibaba-NLP/WebAgent</a> </li> <li>论文：<a class="Link--inTextBlock" href="https://arxiv.org/pdf/2507.02592" rel="nofollow">https://arxiv.org/pdf/2507.02592</a></li> </ul>

ML-Master

<p>ML-Master是上海交通大学人工智能学院Agents团队推出ML-Master – 上海交大推出的AI专家Agent的AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色，以29.3%的平均奖牌率位居榜首，超越了微软的RD-Agent和OpenAI的AIDE等竞争对手。ML-Master通过“探索-推理深度融合”的创新范式，模拟人类专家的认知策略，整合广泛探索与深度推理，显著提升了AI在机器学习工程中的表现。采用平衡多轨迹探索和可控推理两大模块，通过自适应记忆机制实现两者的高效协同。</p> <h2 style="font-size: 20px;">ML-Master的项目地址</h2> <ul> <li>项目官网：https://sjtu-sai-agents.github.io/ML-Master/</li> <li>Github仓库：https://github.com/sjtu-sai-agents/ML-Master</li> <li>arXiv技术论文：https://arxiv.org/pdf/2506.16499</li> </ul>

ComputerX

<p>ComputerX是基于人工智能的AI Agent工具，通过自然语言指令帮助用户自动化处理各种计算机任务，提升工作效率。能处理多种任务，如旅行规划、数据分析、报告生成、网页应用创建等，支持文本、表格、图像和代码等多种输出格式。ComputerX基于 AI 技术整合来自多个在线来源的信息，提供全面且准确的结果，保持任务执行过程的透明性。</p> <h2 style="font-size: 20px;">ComputerX的官网地址</h2> <ul> <li>官网地址：<a href="https://computerx.ai/?utm_source=medsci" target="_blank" rel="noopener"> https://computerx.ai/</a></li> </ul>

Miniwork

<p>Miniwork是高效的AI工具平台，聚焦提升工作、学习、内容创作、运营营销等多个方向，专为提升工作与学习效率的用户打造。Miniwork涵盖SEO分析及优化、写作辅助、图像生成、PDF处理、营销策划及运营管理等多元化AI工具，通过前沿技术集成包括GPT-4o、Claude 3.7 sonnet、Gemini 1.5 Flash、Llama 3.1、DeepSeek-R1、GLM-4-plus等在内的多个AI模型。帮助用户应对各类任务场景，提供精准的智能化解决方案，让复杂工作变得简单高效。</p> <h2 style="font-size: 20px;">MiniWork的官网地址</h2> <ul> <li>官网地址： <a href="https://miniwork.ai/en" target="_blank" rel="noopener">https://miniwork.ai/en</a> </li> </ul>

FloweAI

<p>FloweAI是通用型AI Agent，支持基于自然语言指令高效完成各类任务。FloweAI能快速制作PPT、撰写文档、发送邮件、进行深度研究并生成专业报告。FloweAI界面简洁，支持多任务并行处理，具备强大的智能自动化能力，适用学生、职场人士和企业用户。FloweAI能处理日常任务，应对复杂工作流程，基于持续更新和功能扩展，成为用户日常工作和学习中的得力助手。</p> <h2 style="font-size: 20px;">FloweAI的主要功能</h2> <ul> <li>发送邮件：撰写和发送专业邮件。自动跟进对话，管理邮件通信。</li> <li>深度研究：对任何主题进行综合研究。从多个来源收集见解，汇编详细的研究结果。</li> <li>撰写报告：创建专业报告。分析数据，以清晰、结构化的文档呈现信息。</li> <li>制作演示文稿：设计引人入胜的演示文稿。</li> <li>多任务处理：支持多任务并行处理，支持关闭选项卡后台运行，或设置特定时间自动运行任务。</li> <li>文档生成：自动生成Google Docs文档。</li> <li>网页浏览与自动化：自主浏览网页、自动填写网页表格。</li> </ul> <h2 style="font-size: 20px;">FloweAI的官网地址</h2> <ul> <li>官网地址： <a href="https://floweai.com/" target="_blank" rel="noopener">https://floweai.com/</a> </li> </ul>

Jenius

<p>Jenius 是天聚地合（苏州）科技股份有限公司推出的通用型AI Agent产品。通过多智能体协作架构，将复杂任务分解为多个子任务，由不同的智能体分工完成，例如规划、执行和验证等。模仿了人类处理任务的逻辑，能高效地完成从需求理解到任务执行的全链路闭环操作。Jenius 整合了近千种实时数据接口，涵盖汇率、天气、新闻等多种数据源，结合用户偏好和历史行为，生成高性价比的解决方案。通过 RPA 技术实现自动化操作，例如自动完成旅行预订或报表生成等任务。Jenius 具备自适应学习能力，能根据用户反馈不断优化流程，提供个性化服务。</p>

HiAgent

<p>HiAgent 是字节跳动推出的面向企业级客户的人工智能应用开发平台。帮助企业快速开发大模型应用和智能体（Agent），满足企业对数据安全和隐私的要求。通过低代码开发工具，HiAgent 降低了开发门槛，非技术背景的业务人员也能轻松上手，快速构建和部署 AI 应用。HiAgent 提供了丰富的行业模板和私有化部署选项，能满足不同企业的个性化需求。支持与企业现有系统的深度集成，帮助企业实现复杂流程的自动化和智能化。</p> <div class="banner-des-text_91704 banner-des-text-light_91704">HiAgent基于Agent DevOps理念，提供智能体开发、评测、观测、优化全生命周期管理，支持模型接入、推理、精调及私有化集成，助力企业高效构建生产级高价值智能体，实现从模型到应用的全链路打通。</div> <h2 style="font-size: 20px;">HiAgent的主要功能</h2> <ul> <li> <div class="paragraph">全生命周期管理：涵盖策略规划、能力开发、效果评测、应用发布、线上观测和持续调优等环节，帮助企业高效构建和管理生产级智能体。</div> </li> <li> <div class="paragraph">低代码开发：提供低代码可视化编排工具，业务人员可通过图形界面快速构建智能体或工作流，内置多种提示词模板和行业应用模板。</div> </li> <li> <div class="paragraph">模型接入与支持：内置火山引擎「豆包」系列模型，并支持第三方大模型接入及混合部署。</div> </li> <li> <div class="paragraph">知识库管理：内置企业知识库功能，支持高级检索增强生成（Advanced RAG），可实现上下文“记忆”，确保回答的准确性和时效性。</div> </li> <li> <div class="paragraph">多模态支持：支持文本对话、图像生成、语音合成/识别等多种模态，适配丰富场景。</div> </li> <li> <div class="paragraph">丰富的插件中心：提供100+企业业务插件，覆盖新闻检索、办公工具、图像识别等领域，支持自定义插件。</div> </li> <li> <div class="paragraph">安全与部署：支持公有云托管、混合云部署和本地私有化部署，具备完善的数据防护机制，确保数据安全。</div> </li> <li> <div class="paragraph">团队协作：支持多用户工作空间和多角色权限管理，满足企业协同开发和管理需求。</div> </li> </ul> <h2 style="font-size: 20px;">HiAgent的官网地址</h2> <ul> <li>官网地址： <a href="https://www.volcengine.com/product/hiagent" target="_blank" rel="noopener">https://www.volcengine.com/product/hiagent</a> </li> </ul>

Teamo

<p>Teamo是夕小瑶团队推出的创新的多Agent协作AI生产力平台。通过模拟真实团队协作，由CEO Agent指挥多个专业Agent（如搜索员、咨询顾问、写作员等）协同工作，高效完成复杂任务。核心功能是“超级搜写”，能快速理解用户需求，深度调研信息，生成高质量的文稿。Teamo采用Agent2Agent（A2A）协作模式，可自主调度全球AI模型，通过并行工作和协同竞争，打破传统AI的局限。适用于科研、金融、媒体等多个领域，能快速产出如综述论文、商业策划等复杂内容。</p> <h2 style="font-size: 20px;">Teamo的主要功能</h2> <ul> <li> <div class="paragraph">超级搜写功能：是Teamo的核心功能，能快速理解用户的复杂需求，进行全网深度信息检索与筛选，并将分析后的洞察组织成逻辑清晰、语言流畅的专业文稿。</div> </li> <li>多Agent协作模式 <ul> <li> <div class="paragraph">CEO Agent指挥体系：Teamo的核心在于其独创的“CEO Agent”指挥专业Agent协同工作的模式。CEO Agent作为团队的总指挥，负责理解用户的复杂需求，将任务拆解并分配给不同领域的专业Agent，如搜索员、咨询顾问、写作员、设计师等。</div> </li> <li> <div class="paragraph">Agent角色分工明确：</div> <ul> <li> <div class="paragraph">搜索组长（Search Agent）：负责在全网（包括学术数据库、专业报告、新闻媒体等）进行深度信息检索与筛选。</div> </li> <li> <div class="paragraph">咨询组长（Consultant Agent）：对收集来的信息进行深度分析、提炼观点、洞察趋势。</div> </li> <li> <div class="paragraph">写作组长（Writer Agent）：将分析后的洞察组织成逻辑清晰、语言流畅的专业文稿。</div> </li> <li> <div class="paragraph">美工/研发组长（Designer/Developer Agent）：提供排版、设计、数据分析等更多维度的能力支持。</div> </li> </ul> </li> </ul> </li> </ul> <h2 style="font-size: 20px;">Teamo的技术原理</h2> <ul> <li> <div class="paragraph">A2A协议：A2A协议是多Agent协作的核心，实现不同平台、不同厂商之间的智能体协作。支持Agent之间的安全协作、任务状态管理、用户体验协商和功能发现。</div> </li> <li> <div class="paragraph">MCP协议：MCP协议强调“模型+工具+多Agent”的混合协作流，支持意图声明、任务调度、插件封装和状态传递。进一步提升了Agent的自主理解和协作能力。</div> </li> </ul> <h2 style="font-size: 20px;">Teamo的官网地址</h2> <ul> <li>官网地址： <a href="https://teamo.floatmiracle.com/index" target="_blank" rel="noopener">https://teamo.floatmiracle.com/index</a> </li> </ul>

小云雀

<p>字节跳动旗下剪映团队近期推出了一款面向短视频创作者、电商营销人员以及普通用户的视频内容创作 Agent，名为「小云雀 AI」，主打“灵感即所得，创作零门槛”。「小云雀AI」已经接入豆包和DeepSeek，目前仅安卓可下载，iOS 预计 6 月发布。</p> <p>不同于传统 AI 工具仅提供一个通用输入框，「小云雀AI」先让用户明确选择场景（如智能成片、数字人视频、AI 设计、AI 换背景等），以此避免生成内容“跑题”，提升了交互效率和结果的相关性。</p> <h2 style="font-size: 20px;">如何使用小云雀</h2> <ul> <li>下载应用：安卓用户访问<a class="external" href="https://sj.qq.com/appdetail/com.commercepro.and" target="_blank" rel="noopener nofollow">腾讯应用宝： https://sj.qq.com/appdetail/com.commercepro.and</a></li> </ul>

Company Research Agent

<p>Company Research Agent是基于多智能体框架的公司研究工具，支持一键自动生成全面的公司研究报告。工具从公司网站、新闻文章、财务报告和行业分析等多源数据中收集信息，基于Gemini 2.5 Flash和GPT-4.1-mini等模型进行高语境研究综合及精确的报告格式化和编辑。工具具备AI内容过滤功能，确保信息的相关性和准确性，基于WebSocket实现实时进度流，为用户提供高效、便捷的研究体验。</p> <h2 style="font-size: 20px;">Company Research Agent的主要功能</h2> <ul> <li>多源数据收集：从公司网站、新闻文章、财务报告和行业分析等多种来源收集信息。</li> <li>高语境研究综合：基于 Gemini 2.0 Flash 模型处理和汇总大量数据，生成初始简报。</li> <li>精确报告格式化：用 GPT-4.1-mini 模型进行最终报告的汇编和格式化，确保报告的精确性和一致性。</li> <li>内容过滤与管理：基于 Tavily 的相关性评分系统过滤内容，确保信息的相关性和准确性。</li> </ul> <h2 style="font-size: 20px;">Company Research Agent的项目地址</h2> <ul> <li>项目官网：<a class="external" href="https://companyresearcher.tavily.com/?utm_source=medsci" target="_blank" rel="noopener">https://companyresearcher.tavily.com/</a></li> <li>GitHub仓库：<a class="external" href="https://github.com/pogjester/company-research-agent" target="_blank" rel="noopener nofollow">https://github.com/pogjester/company-research-agent</a></li> </ul>

星辰心流

<p>心流是阿里巴巴推出的基于星辰大模型的AI搜索助手，通过智能技术提升用户的知识获取效率。集成了近3000万篇学术论文资源，覆盖Nature、IEEE、ArXiv等权威期刊，支持学术问答、AI精读、段落总结、智能翻译和名词解释等功能，能帮助研究人员和学生快速理解和分析论文内容。心流提供DeepSeek渠道，联网搜索协助思考过程，具备通用问答、慢推理、私人知识库等功能，适用于市场调研、文档分析、内容创作等多种场景。用户可以通过网页版、手机APP或Chrome浏览器插件使用心流，享受高效、智能的知识管理体验。</p> <h2 style="font-size: 20px;">心流的主要功能</h2> <ul> <li> <div class="paragraph">AI智能搜索与问答</div> <ul> <li> <div class="paragraph">通用问答：支持广泛的问答需求，包括市场调研、活动总结、文档分析等。心流的回答会展示搜索来源，使答案更可信。</div> </li> <li> <div class="paragraph">慢推理：针对复杂问题，支持多轮思考和深度分析，帮助用户进行辩证性思考。</div> </li> <li> <div class="paragraph">学术问答：集成近3000万篇学术论文资源（包括Nature、IEEE、ArXiv等），支持AI精读、段落总结、智能翻译和名词解释。</div> </li> </ul> </li> <li> <div class="paragraph">学术研究辅助</div> <ul> <li> <div class="paragraph">论文资源：提供丰富的学术论文资源，无需下载即可直接阅读。</div> </li> <li> <div class="paragraph">AI辅助阅读器：支持长文本总结、翻译和短文本解释，帮助用户快速理解论文内容。</div> </li> <li> <div class="paragraph">引用跳转：点击论文中的引用标志，可直接显示引用论文的摘要。</div> </li> <li> <div class="paragraph">论文精读功能：用户可以通过选中段落，调用AI能力进行总结、翻译或解释，并将结果保存到笔记中。</div> </li> </ul> </li> <li> <div class="paragraph">知识管理与创作辅助</div> <ul> <li> <div class="paragraph">私人知识库：用户可以上传自己的文献或文档，心流会根据这些内容进行针对性搜索和分析，提升文献阅读效率。</div> </li> <li> <div class="paragraph">笔记功能：用户可以保存AI生成的内容到笔记中，方便随时查看和回顾。</div> </li> <li> <div class="paragraph">内容创作辅助：支持生成播客内容，将文字答案转化为双人对话模式的播客，使内容更生动。</div> </li> </ul> </li> <li class="paragraph">答案生成播客：将文字内容转化为播客，适合不想阅读文字的用户。</li> <li class="paragraph">心流模式：提供无线画布设计，适合汇报或头脑风暴场景。</li> <li class="paragraph">连网搜索：通过DeepSeek渠道，结合联网搜索协助用户思考。</li> </ul> <h2 style="font-size: 20px;">如何使用心流</h2> <ul class="text-md"> <li>访问平台：访问星辰心流的官网 <a href="https://iflow.cn/" target="_blank" rel="noopener">iflow.cn</a></li> </ul>

分类导航