Company Research Agent是基于多智能体框架的公司研究工具,支持一键自动生成全面的公司研究报告。工具从公司网站、新闻文章、财务报告和行业分析等多源数据中收集信息,基于Gemini 2.5 Flash和GPT-4.1-mini等模型进行高语境研究综合及精确的报告格式化和编辑。工具具备AI内容过滤功能,确保信息的相关性和准确性,基于WebSocket实现实时进度流,为用户提供高效、便捷的研究体验。

Company Research Agent的主要功能

  • 多源数据收集:从公司网站、新闻文章、财务报告和行业分析等多种来源收集信息。
  • 高语境研究综合:基于 Gemini 2.0 Flash 模型处理和汇总大量数据,生成初始简报。
  • 精确报告格式化:用 GPT-4.1-mini 模型进行最终报告的汇编和格式化,确保报告的精确性和一致性。
  • 内容过滤与管理:基于 Tavily 的相关性评分系统过滤内容,确保信息的相关性和准确性。

Company Research Agent的项目地址

相关推荐

FinGenius

FinGenius

<p>FinGenius 是全球首个A股AI金融博弈智能体应用。FinGenius基于多Agent博弈架构,模拟市场参与者行为,用16个超级智能体(如舆情、游资、风控等)分工协作,快速生成精准的金融分析报告。FinGenius 引入博弈论优化决策,结合“年轮记忆规则算法”记录用户投资习惯,提供个性化分析。FinGenius 支持用AI重塑金融分析,提升决策效率,为投资者和金融机构提供创新解决方案。</p> <h2 style="font-size: 20px;">FinGenius 的主要功能</h2> <ul> <li>多Agent博弈系统:多个专业智能体(如舆情、游资、风控等)分工协作,从不同角度分析市场数据,生成综合报告。模拟市场参与者互动,优化决策过程,预测市场走势。</li> <li>深度数据整合与报告生成:整合多种数据源,快速生成结构化多模态报告,提炼关键信息和风险点。</li> <li>实时数据处理:毫秒级处理海量金融数据,实时监控市场异常,提前识别潜在风险。</li> <li> <div class="paragraph">风险预警系统:实时监控市场异常,提前识别潜在风险,为金融分析提供安全保障。</div> </li> <li>MCP智能调用与工具集成:基于 Model Context Protocol (MCP),实现模型间无缝协作,支持即插即用的金融工具生态。</li> </ul> <h2 style="font-size: 20px;">FinGenius的官网地址</h2> <ul> <li>官网地址: <a href="http://fingenius.cn/" target="_blank" rel="noopener">http://fingenius.cn/</a> </li> <li>GitHub仓库: <a href="https://github.com/HuaYaoAI/FinGenius" target="_blank" rel="noopener">https://github.com/HuaYaoAI/FinGenius</a> </li> </ul>

JoyAgent-JDGenie

JoyAgent-JDGenie

<div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">业界首个开源高完成度轻量化通用多智能体产品(JoyAgent-JDGenie)</h2> <a id="user-content-业界首个开源高完成度轻量化通用多智能体产品joyagent-jdgenie" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E4%B8%9A%E7%95%8C%E9%A6%96%E4%B8%AA%E5%BC%80%E6%BA%90%E9%AB%98%E5%AE%8C%E6%88%90%E5%BA%A6%E8%BD%BB%E9%87%8F%E5%8C%96%E9%80%9A%E7%94%A8%E5%A4%9A%E6%99%BA%E8%83%BD%E4%BD%93%E4%BA%A7%E5%93%81joyagent-jdgenie" aria-label="Permalink: 业界首个开源高完成度轻量化通用多智能体产品(JoyAgent-JDGenie)"></a></div> <p>解决快速构建多智能体产品的最后一公里问题</p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">简介</h2> <a id="user-content-简介" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E7%AE%80%E4%BB%8B" aria-label="Permalink: 简介"></a></div> <p>当前相关开源agent主要是SDK或者框架,用户还需基于此做进一步的开发,无法直接做到开箱即用。我们开源的JoyAgent-JDGenie是端到端的多Agent产品,对于输入的query或者任务,可以直接回答或者解决。例如用户query"给我做一个最近美元和黄金的走势分析",JoyAgent-Genie可以直接给出网页版或者PPT版的报告文档。</p> <p>JoyAgent-JDGenie是一个通用的多智能体框架,对于用户需要定制的一些新场景功能,只需将相关的子智能体或者工具挂载到JoyAgent-Genie即可。为了验证JoyAgent-JDGenie的通用性,在GAIA榜单准确率达到75.15%,已超越OWL(CAMEL)、Smolagent(Huggingface)、LRC-Huawei(Huawei)、xManus(OpenManus)、AutoAgent(香港大学)等行业知名产品。</p> <p>此外,我们的开源多智能体产品JoyAgent-JDGenie相对比较轻量,不像阿里的SpringAI-Alibaba需要依赖阿里云百炼平台相关功能(基于百炼平台调用LLM),Coze依赖火山引擎平台。</p> <p>我们整体开源了智能体产品JoyAgent-JDGenie,包括前端、后端、框架、引擎、核心子智能体(报告生成智能体、代码智能体、PPT智能体、文件智能体等)、想用微调后效果更好的欢迎使用JoyAgent。</p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">产品对比</h2> <a id="user-content-产品对比" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E4%BA%A7%E5%93%81%E5%AF%B9%E6%AF%94" aria-label="Permalink: 产品对比"></a></div> <table> <thead> <tr> <th>分类</th> <th>agent</th> <th>是否开源</th> <th>是否开源完整产品</th> <th>是否依赖生态</th> </tr> </thead> <tbody> <tr> <td rowspan="2">SDK类</td> <td>SpringAI-Alibaba</td> <td>部分</td> <td>否,只开源SDK(SDK)</td> <td>是(阿里云百炼平台)</td> </tr> <tr> <td>Coze</td> <td>部分</td> <td>否,只开源部分Nieo SDK(SDK)</td> <td>是(火山引擎平台)</td> </tr> <tr> <td rowspan="6">框架类</td> <td>Fellow</td> <td>是</td> <td>否,只开源了Eko智能体框架(框架)</td> <td>否</td> </tr> <tr> <td>Dify</td> <td>是</td> <td>否,只开源了智能体框架,且主要是workflow(框架)</td> <td>否</td> </tr> <tr> <td>SkyworkAI</td> <td>是</td> <td>否,只开源了智能体框架(框架)</td> <td>否</td> </tr> <tr> <td>OpenManus</td> <td>是</td> <td>否,只开源了智能体框架(框架)</td> <td>否</td> </tr> <tr> <td>Owl</td> <td>是</td> <td>否,只开源了智能体框架(框架)</td> <td>否</td> </tr> <tr> <td>n8n</td> <td>是</td> <td>否,只开源了智能体框架,且主要是workflow(框架)</td> <td>否</td> </tr> <tr> <td rowspan="3">协议类</td> <td>MCP</td> <td>是</td> <td>否,只是开源协议</td> <td>否</td> </tr> <tr> <td>A2A</td> <td>是</td> <td>否,只是开源协议</td> <td>否</td> </tr> <tr> <td>AG-UI</td> <td>是</td> <td>否,只是开源协议</td> <td>否</td> </tr> <tr> <td rowspan="2">技术模块类</td> <td>memory0</td> <td>是</td> <td>否,只是开源的技术模块</td> <td>否</td> </tr> <tr> <td>LlamaIndex</td> <td>是</td> <td>否,只是开源的技术模块</td> <td>否</td> </tr> <tr> <td>产品类</td> <td>Our</td> <td>是</td> <td>是,开源端到端完整的Agent产品(产品)</td> <td>否</td> </tr> </tbody> </table> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">框架效果先进性</h2> <a id="user-content-框架效果先进性" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E6%A1%86%E6%9E%B6%E6%95%88%E6%9E%9C%E5%85%88%E8%BF%9B%E6%80%A7" aria-label="Permalink: 框架效果先进性"></a></div> <table> <thead> <tr> <th>Agent</th> <th>Score</th> <th>Score_level1</th> <th>Score_level2</th> <th>Score_level3</th> <th>机构</th> </tr> </thead> <tbody> <tr> <td>Alita v2.1</td> <td>0.8727</td> <td>0.8868</td> <td>0.8953</td> <td>0.7692</td> <td>Princeton</td> </tr> <tr> <td>Skywork</td> <td>0.8242</td> <td>0.9245</td> <td>0.8372</td> <td>0.5769</td> <td>天工</td> </tr> <tr> <td>AWorld</td> <td>0.7758</td> <td>0.8868</td> <td>0.7791</td> <td>0.5385</td> <td>Ant Group</td> </tr> <tr> <td>Langfun</td> <td>0.7697</td> <td>0.8679</td> <td>0.7674</td> <td>0.5769</td> <td>DeepMind</td> </tr> <tr> <td>JoyAgent-JDGenie(Our)</td> <td>0.7515</td> <td>0.8679</td> <td>0.7791</td> <td>0.4230</td> <td>Our</td> </tr> <tr> <td>OWL</td> <td>0.6424</td> <td>0.7547</td> <td>0.6512</td> <td>0.3846</td> <td>CAMEL</td> </tr> <tr> <td>Smolagent</td> <td>0.5515</td> <td>0.6792</td> <td>0.5349</td> <td>0.3462</td> <td>Huggingface</td> </tr> <tr> <td>AutoAgent</td> <td>0.5515</td> <td>0.7170</td> <td>0.5349</td> <td>0.2692</td> <td>HKU</td> </tr> <tr> <td>Magentic</td> <td>0.4606</td> <td>0.5660</td> <td>0.4651</td> <td>0.2308</td> <td>MSR AI Frontiers</td> </tr> <tr> <td>LRC-Huawei</td> <td>0.406</td> <td>0.5283</td> <td>0.4302</td> <td>0.0769</td> <td>Huawei</td> </tr> <tr> <td>xManus</td> <td>0.4061</td> <td>0.8113</td> <td>0.2791</td> <td>0.0000</td> <td>OpenManus</td> </tr> </tbody> </table> <p><a href="https://github.com/jd-opensource/joyagent-jdgenie/blob/main/docs/img/score.png" target="_blank" rel="noopener noreferrer"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://github.com/jd-opensource/joyagent-jdgenie/raw/main/docs/img/score.png"></a></p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">系统架构</h2> <a id="user-content-系统架构" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E7%B3%BB%E7%BB%9F%E6%9E%B6%E6%9E%84" aria-label="Permalink: 系统架构"></a></div> <p><a href="https://github.com/jd-opensource/joyagent-jdgenie/blob/main/docs/img/archi.png" target="_blank" rel="noopener noreferrer"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://github.com/jd-opensource/joyagent-jdgenie/raw/main/docs/img/archi.png"></a></p> <p>本开源项目基于JoyAgent-JDGenie产品开源了整体的产品界面、智能体的多种核心模式(react模式、plan and executor模式等)、多个子智能体(report agent、search agent等)以及多整体间交互协议。</p> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">主要特点和优势</h3> <a id="user-content-主要特点和优势" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E4%B8%BB%E8%A6%81%E7%89%B9%E7%82%B9%E5%92%8C%E4%BC%98%E5%8A%BF" aria-label="Permalink: 主要特点和优势"></a></div> <ul dir="auto"> <li>端到端完整的多智能体产品,开箱即用,支持二次开发</li> <li>智能体框架协议 <ul dir="auto"> <li>支持多种智能体设计模式</li> <li>多智能体上下文管理</li> <li>高并发DAG执行引擎,极致的执行效率</li> </ul> </li> <li>子智能体和工具 <ul dir="auto"> <li>子Agent和工具可插拔:预制多种子智能体和工具</li> <li>多种文件交付样式:html、ppt、markdown</li> <li>plan和工具调用 RL优化迭代</li> <li>全链路流式输出</li> </ul> </li> </ul> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">主要创新点</h3> <a id="user-content-主要创新点" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#%E4%B8%BB%E8%A6%81%E5%88%9B%E6%96%B0%E7%82%B9" aria-label="Permalink: 主要创新点"></a></div> <p><a href="https://github.com/jd-opensource/joyagent-jdgenie/blob/main/docs/img/invo.png" target="_blank" rel="noopener noreferrer"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://github.com/jd-opensource/joyagent-jdgenie/raw/main/docs/img/invo.png"></a></p> <div class="markdown-heading" dir="auto"> <p>multi-level and multi-pattern thinking:结合多种智能体设计模式支持多层级的规划和思考</p> <a id="user-content-multi-level-and-multi-pattern-thinking结合多种智能体设计模式支持多层级的规划和思考" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#multi-level-and-multi-pattern-thinking%E7%BB%93%E5%90%88%E5%A4%9A%E7%A7%8D%E6%99%BA%E8%83%BD%E4%BD%93%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F%E6%94%AF%E6%8C%81%E5%A4%9A%E5%B1%82%E7%BA%A7%E7%9A%84%E8%A7%84%E5%88%92%E5%92%8C%E6%80%9D%E8%80%83" aria-label="Permalink: multi-level and multi-pattern thinking:结合多种智能体设计模式支持多层级的规划和思考"></a></div> <ul dir="auto"> <li>multi-level:work level 和 task level</li> <li>multi-pattern:plan and executor模式和react模式</li> </ul> <div class="markdown-heading" dir="auto"> <p>cross task workflow memory:跨任务级别的相似任务memory</p> <a id="user-content-cross-task-workflow-memory跨任务级别的相似任务memory" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#cross-task-workflow-memory%E8%B7%A8%E4%BB%BB%E5%8A%A1%E7%BA%A7%E5%88%AB%E7%9A%84%E7%9B%B8%E4%BC%BC%E4%BB%BB%E5%8A%A1memory" aria-label="Permalink: cross task workflow memory:跨任务级别的相似任务memory"></a></div> <div class="markdown-heading" dir="auto"> <p>tool evolution via auto-disassembly-and-reassembly of atom-tools</p> <a id="user-content-tool-evolution-via-auto-disassembly-and-reassembly-of-atom-tools" class="anchor" href="https://github.com/jd-opensource/joyagent-jdgenie/tree/main#tool-evolution-via-auto-disassembly-and-reassembly-of-atom-tools" aria-label="Permalink: tool evolution via auto-disassembly-and-reassembly of atom-tools"></a></div> <ul dir="auto"> <li>基于已有工具迭代产生新工具,而不是从0-1直接生成新工具(减少错误工具的生成)</li> <li>基于已有工具隐性拆解为原子工具,并基于原子工具结合大模型自动组合成新工具(不需要花费人力预先定义和拆解原子工具)</li> </ul>

Magentic-UI

Magentic-UI

<p>这个工具不仅可以自动浏览网页、填写表单,还能执行代码、分析文件,关键是整个过程完全透明可控。</p> <h3 style="font-size: 18px;">主要功能</h3> <p>协同规划:通过对话和计划编辑器,与 AI 一起制定详细的任务执行步骤。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/07/17/1752698732_X5FoB00Ns1.png"></p> <p>协同任务执行:可以随时中断和引导任务执行,直接通过网页浏览器或对话进行干预。</p> <p>敏感操作保护:对于关键操作,系统会主动请求用户确认后再执行。</p> <p>计划学习和检索:从之前的运行中学习经验,改进未来的任务自动化,并保存到计划库中。</p> <p>并行任务处理:支持同时运行多个任务,状态指示器会提醒何时需要输入或任务完成。</p> <p>多模态交互:支持文本消息和图片附件,提供丰富的交互体验。</p>

Pokee AI

Pokee AI

<p>Pokee AI 是下一代通用 AI Agent 开发平台。平台基于强化学习(RL)技术构建高效、个性化且交互性强的 AI Agent,替代传统大语言模型进行任务规划和工具调用。Pokee AI 的 Agent 在多步骤任务执行、推理和工具使用方面表现出色,能快速响应用户指令、提供精准服务,适用于电商、开发与创作、企业自动化等多个领域,基于个性化服务与用户建立长期绑定关系,推动 AI 在更多场景中的落地应用。</p> <h2 style="font-size: 20px;">Pokee AI的官网地址</h2> <ul> <li>官网地址:<a class="external" href="https://pokee.ai/?utm_source=ai-bot.cn" target="_blank" rel="noopener nofollow">pokee.ai</a></li> </ul>

NativeMind

NativeMind

<p>NativeMind是开源的完全在本地设备运行的AI助手。NativeMind支持DeepSeek、Qwen、Llama等多种模型,基于Ollama集成能无缝加载和切换。NativeMind功能包括智能对话、网页内容分析、翻译、写作辅助等,均在浏览器内完成,无需云同步。NativeMind确保数据100%本地处理,无云依赖,无追踪,无日志,让用户完全掌控自己的数据。</p> <h2 style="font-size: 20px;">NativeMind的主要功能</h2> <ul> <li>智能对话:具备多标签页上下文感知能力,进行全面的AI对话,能理解并整合不同页面的信息,让对话更连贯、深入。</li> <li>智能内容分析:能即时总结网页内容,快速提取关键信息;支持理解文档内容,帮助用户快速把握核心要点,节省阅读时间。</li> <li>通用翻译:提供全页翻译功能,支持双语并排显示,方便对比查看;支持对选定文本进行翻译,满足不同翻译需求。</li> <li>AI驱动搜索:增强浏览器的搜索能力,直接在浏览器中输入问题,NativeMind自动浏览网页给出精准答案,提升搜索效率。</li> <li>写作增强:自动检测文本,提供智能改写、校对和创意建议,帮助用户优化写作内容,提高写作质量。</li> <li>实时辅助:在浏览网页时,根据上下文动态显示浮动工具栏,提供相关功能按钮,如翻译、总结等,方便用户随时使用。</li> </ul> <h2 style="font-size: 20px;">NativeMind的项目地址</h2> <ul> <li>项目官网: <a href="https://nativemind.app/" target="_blank" rel="noopener">https://nativemind.app/</a> </li> <li>GitHub仓库: <a href="https://github.com/NativeMindBrowser/NativeMindExtension" target="_blank" rel="noopener">https://github.com/NativeMindBrowser/NativeMindExtension</a> </li> </ul>

Agent Zero

Agent Zero

<p>Agent Zero 是开源的、动态的、可扩展的人工智能框架,成为用户个性化的智能助手。不是预设功能的工具,通过用户的指令和任务动态学习和成长。Agent Zero 具备持久记忆功能,能记住之前的解决方案、代码和事实,以便更快地解决未来任务。将计算机操作系统视为完成任务的工具,可以编写代码并使用终端执行任务,支持多代理协作,能创建下属代理以分解和解决复杂任务。Agent Zero 的行为完全由用户定义的系统提示控制,用户可以通过修改提示文件来定制其行为和功能。支持语音输入和输出,提供实时交互的 Web 界面,用户可以在任何时刻干预代理的行为。</p> <h2 style="font-size: 20px;">Agent Zero的地址</h2> <ul> <li>官网: <a href="https://agent-zero.ai/" target="_blank" rel="noopener">https://agent-zero.ai/</a>  </li> <li>Github仓库: <a href="https://github.com/frdel/agent-zero" target="_blank" rel="noopener">https://github.com/frdel/agent-zero</a> </li> </ul>

飞书Aily

飞书Aily

<p>飞书Aily是飞书推出的企业级Agent平台,类似于企业版的Manus。飞书Aily能深度调用公司内部知识库、任务系统和项目进度,并运行MCP,是真正意义上的企业级智能助手。平台解决了通用Agent无法进入企业内部的问题,因为企业数据安全至关重要,且企业数据大多存储在飞书的云文档、多维表格等系统中。Aily能接入飞书专属MCP,如飞书云文档、飞书项目、飞书任务等,满足企业个性化需求,提升工作效率。</p> <p>飞书Aily官网:https://aily.feishu.cn/</p>

WebSailor

WebSailor

<p>WebSailor 是阿里通义实验室开源的网络智能体,专注于复杂信息检索与推理任务。通过创新的数据合成方法(如 SailorFog-QA)和训练技术(如拒绝采样微调和 DUPO 算法),在高难度任务中表现出色,在 BrowseComp 等评测中超越多个知名模型,登顶开源网络智能体榜单。WebSailor 的推理重构技术能高效处理复杂任务,生成简洁且精准的推理链。在复杂场景中表现出色,在简单任务中展现出强大的泛化能力。</p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">WebSailor 的功能</h2> <a id="user-content-️-features-for-websailor" class="anchor" href="https://github.com/Alibaba-NLP/WebAgent?tab=readme-ov-file#%EF%B8%8F-features-for-websailor" aria-label="永久链接:⛵️ WebSailor 的功能"></a></div> <ul dir="auto"> <li>完整的后训练方法使模型能够进行扩展思考和信息搜索,最终使它们能够成功完成以前被认为无法解决的极其复杂的任务。</li> <li>推出SailorFog-QA,这是一个可扩展的 QA 基准测试,具有较高的不确定性和难度,采用新颖的数据合成方法,通过图形采样和信息混淆进行管理。SailorFog-QA 数据示例可在以下位置找到:<a href="https://github.com/Alibaba-NLP/WebAgent/blob/main/WebSailor/dataset/sailorfog-QA.jsonl"><code>WebSailor/dataset/sailorfog-QA.jsonl</code></a></li> <li>有效的训练后流程包括:(1)从专家轨迹中高质量地重建简洁推理,以进行清晰的监督;(2)一个两阶段的训练过程,涉及 RFT 冷启动阶段,然后是重复采样策略优化 (DUPO),这是一种高效的代理 RL 算法,在有效性和效率方面表现出色。</li> <li>WebSailor-72B 的表现明显优于所有开源代理和框架,同时缩小了与领先专有系统的性能差距,在 BrowseComp-en 上获得了12.0%的得分,在 BrowseComp-zh 上获得了30.1%的得分,在 GAIA 上获得了55.4% 的得分。</li> <li>检查站很快就到了。</li> </ul> <h2 style="font-size: 20px;">WebSailor的项目地址</h2> <ul> <li>Github仓库: <a href="https://github.com/Alibaba-NLP/WebAgent" target="_blank" rel="noopener">https://github.com/Alibaba-NLP/WebAgent</a> </li> <li>论文:<a class="Link--inTextBlock" href="https://arxiv.org/pdf/2507.02592" rel="nofollow">https://arxiv.org/pdf/2507.02592</a></li> </ul>

ML-Master

ML-Master

<p>ML-Master是上海交通大学人工智能学院Agents团队推出ML-Master – 上海交大推出的AI专家Agent的AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色,以29.3%的平均奖牌率位居榜首,超越了微软的RD-Agent和OpenAI的AIDE等竞争对手。ML-Master通过“探索-推理深度融合”的创新范式,模拟人类专家的认知策略,整合广泛探索与深度推理,显著提升了AI在机器学习工程中的表现。采用平衡多轨迹探索和可控推理两大模块,通过自适应记忆机制实现两者的高效协同。</p> <h2 style="font-size: 20px;">ML-Master的项目地址</h2> <ul> <li>项目官网:https://sjtu-sai-agents.github.io/ML-Master/</li> <li>Github仓库:https://github.com/sjtu-sai-agents/ML-Master</li> <li>arXiv技术论文:https://arxiv.org/pdf/2506.16499</li> </ul>

ComputerX

ComputerX

<p>ComputerX是基于人工智能的AI Agent工具,通过自然语言指令帮助用户自动化处理各种计算机任务,提升工作效率。能处理多种任务,如旅行规划、数据分析、报告生成、网页应用创建等,支持文本、表格、图像和代码等多种输出格式。ComputerX基于 AI 技术整合来自多个在线来源的信息,提供全面且准确的结果,保持任务执行过程的透明性。</p> <h2 style="font-size: 20px;">ComputerX的官网地址</h2> <ul> <li>官网地址:<a href="https://computerx.ai/?utm_source=medsci" target="_blank" rel="noopener"> https://computerx.ai/</a></li> </ul>

Miniwork

Miniwork

<p>Miniwork是高效的AI工具平台,聚焦提升工作、学习、内容创作、运营营销等多个方向,专为提升工作与学习效率的用户打造。Miniwork涵盖SEO分析及优化、写作辅助、图像生成、PDF处理、营销策划及运营管理等多元化AI工具,通过前沿技术集成包括GPT-4o、Claude 3.7 sonnet、Gemini 1.5 Flash、Llama 3.1、DeepSeek-R1、GLM-4-plus等在内的多个AI模型。帮助用户应对各类任务场景,提供精准的智能化解决方案,让复杂工作变得简单高效。</p> <h2 style="font-size: 20px;">MiniWork的官网地址</h2> <ul> <li>官网地址: <a href="https://miniwork.ai/en" target="_blank" rel="noopener">https://miniwork.ai/en</a> </li> </ul>

FloweAI

FloweAI

<p>FloweAI是通用型AI Agent,支持基于自然语言指令高效完成各类任务。FloweAI能快速制作PPT、撰写文档、发送邮件、进行深度研究并生成专业报告。FloweAI界面简洁,支持多任务并行处理,具备强大的智能自动化能力,适用学生、职场人士和企业用户。FloweAI能处理日常任务,应对复杂工作流程,基于持续更新和功能扩展,成为用户日常工作和学习中的得力助手。</p> <h2 style="font-size: 20px;">FloweAI的主要功能</h2> <ul> <li>发送邮件:撰写和发送专业邮件。自动跟进对话,管理邮件通信。</li> <li>深度研究:对任何主题进行综合研究。从多个来源收集见解,汇编详细的研究结果。</li> <li>撰写报告:创建专业报告。分析数据,以清晰、结构化的文档呈现信息。</li> <li>制作演示文稿:设计引人入胜的演示文稿。</li> <li>多任务处理:支持多任务并行处理,支持关闭选项卡后台运行,或设置特定时间自动运行任务。</li> <li>文档生成:自动生成Google Docs文档。</li> <li>网页浏览与自动化:自主浏览网页、自动填写网页表格。</li> </ul> <h2 style="font-size: 20px;">FloweAI的官网地址</h2> <ul> <li>官网地址: <a href="https://floweai.com/" target="_blank" rel="noopener">https://floweai.com/</a> </li> </ul>

Jenius

Jenius

<p>Jenius 是天聚地合(苏州)科技股份有限公司推出的通用型AI Agent产品。通过多智能体协作架构,将复杂任务分解为多个子任务,由不同的智能体分工完成,例如规划、执行和验证等。模仿了人类处理任务的逻辑,能高效地完成从需求理解到任务执行的全链路闭环操作。Jenius 整合了近千种实时数据接口,涵盖汇率、天气、新闻等多种数据源,结合用户偏好和历史行为,生成高性价比的解决方案。通过 RPA 技术实现自动化操作,例如自动完成旅行预订或报表生成等任务。Jenius 具备自适应学习能力,能根据用户反馈不断优化流程,提供个性化服务。</p>

HiAgent

HiAgent

<p>HiAgent 是字节跳动推出的面向企业级客户的人工智能应用开发平台。帮助企业快速开发大模型应用和智能体(Agent),满足企业对数据安全和隐私的要求。通过低代码开发工具,HiAgent 降低了开发门槛,非技术背景的业务人员也能轻松上手,快速构建和部署 AI 应用。HiAgent 提供了丰富的行业模板和私有化部署选项,能满足不同企业的个性化需求。支持与企业现有系统的深度集成,帮助企业实现复杂流程的自动化和智能化。</p> <div class="banner-des-text_91704 banner-des-text-light_91704">HiAgent基于Agent DevOps理念,提供智能体开发、评测、观测、优化全生命周期管理,支持模型接入、推理、精调及私有化集成,助力企业高效构建生产级高价值智能体,实现从模型到应用的全链路打通。</div> <h2 style="font-size: 20px;">HiAgent的主要功能</h2> <ul> <li> <div class="paragraph">全生命周期管理:涵盖策略规划、能力开发、效果评测、应用发布、线上观测和持续调优等环节,帮助企业高效构建和管理生产级智能体。</div> </li> <li> <div class="paragraph">低代码开发:提供低代码可视化编排工具,业务人员可通过图形界面快速构建智能体或工作流,内置多种提示词模板和行业应用模板。</div> </li> <li> <div class="paragraph">模型接入与支持:内置火山引擎「豆包」系列模型,并支持第三方大模型接入及混合部署。</div> </li> <li> <div class="paragraph">知识库管理:内置企业知识库功能,支持高级检索增强生成(Advanced RAG),可实现上下文“记忆”,确保回答的准确性和时效性。</div> </li> <li> <div class="paragraph">多模态支持:支持文本对话、图像生成、语音合成/识别等多种模态,适配丰富场景。</div> </li> <li> <div class="paragraph">丰富的插件中心:提供100+企业业务插件,覆盖新闻检索、办公工具、图像识别等领域,支持自定义插件。</div> </li> <li> <div class="paragraph">安全与部署:支持公有云托管、混合云部署和本地私有化部署,具备完善的数据防护机制,确保数据安全。</div> </li> <li> <div class="paragraph">团队协作:支持多用户工作空间和多角色权限管理,满足企业协同开发和管理需求。</div> </li> </ul> <h2 style="font-size: 20px;">HiAgent的官网地址</h2> <ul> <li>官网地址: <a href="https://www.volcengine.com/product/hiagent" target="_blank" rel="noopener">https://www.volcengine.com/product/hiagent</a> </li> </ul>

Teamo

Teamo

<p>Teamo是夕小瑶团队推出的创新的多Agent协作AI生产力平台。通过模拟真实团队协作,由CEO Agent指挥多个专业Agent(如搜索员、咨询顾问、写作员等)协同工作,高效完成复杂任务。核心功能是“超级搜写”,能快速理解用户需求,深度调研信息,生成高质量的文稿。Teamo采用Agent2Agent(A2A)协作模式,可自主调度全球AI模型,通过并行工作和协同竞争,打破传统AI的局限。适用于科研、金融、媒体等多个领域,能快速产出如综述论文、商业策划等复杂内容。</p> <h2 style="font-size: 20px;">Teamo的主要功能</h2> <ul> <li> <div class="paragraph">超级搜写功能:是Teamo的核心功能,能快速理解用户的复杂需求,进行全网深度信息检索与筛选,并将分析后的洞察组织成逻辑清晰、语言流畅的专业文稿。</div> </li> <li>多Agent协作模式 <ul> <li> <div class="paragraph">CEO Agent指挥体系:Teamo的核心在于其独创的“CEO Agent”指挥专业Agent协同工作的模式。CEO Agent作为团队的总指挥,负责理解用户的复杂需求,将任务拆解并分配给不同领域的专业Agent,如搜索员、咨询顾问、写作员、设计师等。</div> </li> <li> <div class="paragraph">Agent角色分工明确:</div> <ul> <li> <div class="paragraph">搜索组长(Search Agent):负责在全网(包括学术数据库、专业报告、新闻媒体等)进行深度信息检索与筛选。</div> </li> <li> <div class="paragraph">咨询组长(Consultant Agent):对收集来的信息进行深度分析、提炼观点、洞察趋势。</div> </li> <li> <div class="paragraph">写作组长(Writer Agent):将分析后的洞察组织成逻辑清晰、语言流畅的专业文稿。</div> </li> <li> <div class="paragraph">美工/研发组长(Designer/Developer Agent):提供排版、设计、数据分析等更多维度的能力支持。</div> </li> </ul> </li> </ul> </li> </ul> <h2 style="font-size: 20px;">Teamo的技术原理</h2> <ul> <li> <div class="paragraph">A2A协议:A2A协议是多Agent协作的核心,实现不同平台、不同厂商之间的智能体协作。支持Agent之间的安全协作、任务状态管理、用户体验协商和功能发现。</div> </li> <li> <div class="paragraph">MCP协议:MCP协议强调“模型+工具+多Agent”的混合协作流,支持意图声明、任务调度、插件封装和状态传递。进一步提升了Agent的自主理解和协作能力。</div> </li> </ul> <h2 style="font-size: 20px;">Teamo的官网地址</h2> <ul> <li>官网地址: <a href="https://teamo.floatmiracle.com/index" target="_blank" rel="noopener">https://teamo.floatmiracle.com/index</a> </li> </ul>

小云雀

小云雀

<p>字节跳动旗下剪映团队近期推出了一款面向短视频创作者、电商营销人员以及普通用户的视频内容创作 Agent,名为「小云雀 AI」,主打“灵感即所得,创作零门槛”。「小云雀AI」已经接入豆包和DeepSeek,目前仅安卓可下载,iOS 预计 6 月发布。</p> <p>不同于传统 AI 工具仅提供一个通用输入框,「小云雀AI」先让用户明确选择场景(如智能成片、数字人视频、AI 设计、AI 换背景等),以此避免生成内容“跑题”,提升了交互效率和结果的相关性。</p> <h2 style="font-size: 20px;">如何使用小云雀</h2> <ul> <li>下载应用:安卓用户访问<a class="external" href="https://sj.qq.com/appdetail/com.commercepro.and" target="_blank" rel="noopener nofollow">腾讯应用宝: https://sj.qq.com/appdetail/com.commercepro.and</a></li> </ul>

星辰心流

星辰心流

<p>心流是阿里巴巴推出的基于星辰大模型的AI搜索助手,通过智能技术提升用户的知识获取效率。集成了近3000万篇学术论文资源,覆盖Nature、IEEE、ArXiv等权威期刊,支持学术问答、AI精读、段落总结、智能翻译和名词解释等功能,能帮助研究人员和学生快速理解和分析论文内容。心流提供DeepSeek渠道,联网搜索协助思考过程,具备通用问答、慢推理、私人知识库等功能,适用于市场调研、文档分析、内容创作等多种场景。用户可以通过网页版、手机APP或Chrome浏览器插件使用心流,享受高效、智能的知识管理体验。</p> <h2 style="font-size: 20px;">心流的主要功能</h2> <ul> <li> <div class="paragraph">AI智能搜索与问答</div> <ul> <li> <div class="paragraph">通用问答:支持广泛的问答需求,包括市场调研、活动总结、文档分析等。心流的回答会展示搜索来源,使答案更可信。</div> </li> <li> <div class="paragraph">慢推理:针对复杂问题,支持多轮思考和深度分析,帮助用户进行辩证性思考。</div> </li> <li> <div class="paragraph">学术问答:集成近3000万篇学术论文资源(包括Nature、IEEE、ArXiv等),支持AI精读、段落总结、智能翻译和名词解释。</div> </li> </ul> </li> <li> <div class="paragraph">学术研究辅助</div> <ul> <li> <div class="paragraph">论文资源:提供丰富的学术论文资源,无需下载即可直接阅读。</div> </li> <li> <div class="paragraph">AI辅助阅读器:支持长文本总结、翻译和短文本解释,帮助用户快速理解论文内容。</div> </li> <li> <div class="paragraph">引用跳转:点击论文中的引用标志,可直接显示引用论文的摘要。</div> </li> <li> <div class="paragraph">论文精读功能:用户可以通过选中段落,调用AI能力进行总结、翻译或解释,并将结果保存到笔记中。</div> </li> </ul> </li> <li> <div class="paragraph">知识管理与创作辅助</div> <ul> <li> <div class="paragraph">私人知识库:用户可以上传自己的文献或文档,心流会根据这些内容进行针对性搜索和分析,提升文献阅读效率。</div> </li> <li> <div class="paragraph">笔记功能:用户可以保存AI生成的内容到笔记中,方便随时查看和回顾。</div> </li> <li> <div class="paragraph">内容创作辅助:支持生成播客内容,将文字答案转化为双人对话模式的播客,使内容更生动。</div> </li> </ul> </li> <li class="paragraph">答案生成播客:将文字内容转化为播客,适合不想阅读文字的用户。</li> <li class="paragraph">心流模式:提供无线画布设计,适合汇报或头脑风暴场景。</li> <li class="paragraph">连网搜索:通过DeepSeek渠道,结合联网搜索协助用户思考。</li> </ul> <h2 style="font-size: 20px;">如何使用心流</h2> <ul class="text-md"> <li>访问平台:访问星辰心流的官网 <a href="https://iflow.cn/" target="_blank" rel="noopener">iflow.cn</a></li> </ul>

Operator

Operator

<p>Operator是OpenAI推出的首款AI智能体。能像人类一样操作网页浏览器的AI工具,可以自动完成各种在线任务,如预订餐厅、购买机票、填写表单等。Operator基于Computer-Using Agent(CUA)的新模型驱动,模型结合了GPT-4o的视觉能力和强化学习的高级推理能力。通过屏幕截图“观察”网页,使用虚拟鼠标和键盘进行操作。Operator目前处于研究预览阶段,仅对美国的ChatGPT Pro用户开放。未来,OpenAI计划将其扩展到更多用户群体,并集成到ChatGPT中。</p> <p><img src="https://img.medsci.cn/aisite/img//4KBMjmOPNmU5cSLBwi1osey2GgAMZVtXnzOFGkU2.png"></p> <h2 style="font-size: 20px;">Operator的主要功能</h2> <ul> <li>自动化任务执行:Operator能自动完成多种在线任务,如预订餐厅、购买机票、在线购物、填写表单等。</li> <li>多任务处理:支持同时运行多个任务,例如在不同网站上预订旅行和购物。</li> <li>个性化设置:用户可以设置偏好(如首选航空公司)并保存常用任务,以便快速执行。</li> <li>自我纠错与推理能力:在遇到问题时,Operator能通过推理自我调整,若无法解决则交还用户控制。</li> <li>安全与隐私保护:在涉及敏感信息(如登录、支付)时,Operator会请求用户接管,拒绝执行高风险任务。</li> </ul> <h2 style="font-size: 20px;">Operator的技术原理</h2> <ul> <li>Computer-Using Agent (CUA)模型:模型结合了GPT-4o的视觉识别能力和通过强化学习获得的高级推理能力。Operator能理解和交互图形用户界面(GUI),像人类用户一样操作网页。 <ul> <li>感知(Perception):Operator通过屏幕截图获取当前界面的信息。使用GPT-4o的视觉能力分析截图,识别界面元素如按钮、菜单和文本框。</li> <li>推理(Reasoning):基于强化学习的推理能力,Operator规划下一步操作。通过“内心独白”机制,评估观察结果、跟踪中间步骤并动态调整。</li> <li>行动(Action):执行操作,如点击、滚动或键入。在任务完成或需要用户输入时停止操作。</li> </ul> </li> <li>视觉能力:Operator通过屏幕截图“看到”网页内容。识别和理解GUI元素,无需依赖特定操作系统或网络API。</li> <li>强化学习:通过强化学习,Operator获得高级推理能力。能自我纠错,当遇到挑战或犯错时,可以基于推理能力进行自我调整。</li> <li>自我纠错与学习:在执行任务过程中,如果出现错误,Operator能检测到问题所在。通过重新尝试或提示用户确认,Operator能纠正错误。</li> </ul> <h2 style="font-size: 20px;">如何使用Operator</h2> <ul> <li>Operator的官方网站: <a href="https://operator.chatgpt.com/" target="_blank" rel="noopener">https://operator.chatgpt.com/</a> </li> </ul>