业界首个开源高完成度轻量化通用多智能体产品(JoyAgent-JDGenie)

解决快速构建多智能体产品的最后一公里问题

简介

当前相关开源agent主要是SDK或者框架,用户还需基于此做进一步的开发,无法直接做到开箱即用。我们开源的JoyAgent-JDGenie是端到端的多Agent产品,对于输入的query或者任务,可以直接回答或者解决。例如用户query"给我做一个最近美元和黄金的走势分析",JoyAgent-Genie可以直接给出网页版或者PPT版的报告文档。

JoyAgent-JDGenie是一个通用的多智能体框架,对于用户需要定制的一些新场景功能,只需将相关的子智能体或者工具挂载到JoyAgent-Genie即可。为了验证JoyAgent-JDGenie的通用性,在GAIA榜单准确率达到75.15%,已超越OWL(CAMEL)、Smolagent(Huggingface)、LRC-Huawei(Huawei)、xManus(OpenManus)、AutoAgent(香港大学)等行业知名产品。

此外,我们的开源多智能体产品JoyAgent-JDGenie相对比较轻量,不像阿里的SpringAI-Alibaba需要依赖阿里云百炼平台相关功能(基于百炼平台调用LLM),Coze依赖火山引擎平台。

我们整体开源了智能体产品JoyAgent-JDGenie,包括前端、后端、框架、引擎、核心子智能体(报告生成智能体、代码智能体、PPT智能体、文件智能体等)、想用微调后效果更好的欢迎使用JoyAgent。

产品对比

分类 agent 是否开源 是否开源完整产品 是否依赖生态
SDK类 SpringAI-Alibaba 部分 否,只开源SDK(SDK) 是(阿里云百炼平台)
Coze 部分 否,只开源部分Nieo SDK(SDK) 是(火山引擎平台)
框架类 Fellow 否,只开源了Eko智能体框架(框架)
Dify 否,只开源了智能体框架,且主要是workflow(框架)
SkyworkAI 否,只开源了智能体框架(框架)
OpenManus 否,只开源了智能体框架(框架)
Owl 否,只开源了智能体框架(框架)
n8n 否,只开源了智能体框架,且主要是workflow(框架)
协议类 MCP 否,只是开源协议
A2A 否,只是开源协议
AG-UI 否,只是开源协议
技术模块类 memory0 否,只是开源的技术模块
LlamaIndex 否,只是开源的技术模块
产品类 Our 是,开源端到端完整的Agent产品(产品)

框架效果先进性

Agent Score Score_level1 Score_level2 Score_level3 机构
Alita v2.1 0.8727 0.8868 0.8953 0.7692 Princeton
Skywork 0.8242 0.9245 0.8372 0.5769 天工
AWorld 0.7758 0.8868 0.7791 0.5385 Ant Group
Langfun 0.7697 0.8679 0.7674 0.5769 DeepMind
JoyAgent-JDGenie(Our) 0.7515 0.8679 0.7791 0.4230 Our
OWL 0.6424 0.7547 0.6512 0.3846 CAMEL
Smolagent 0.5515 0.6792 0.5349 0.3462 Huggingface
AutoAgent 0.5515 0.7170 0.5349 0.2692 HKU
Magentic 0.4606 0.5660 0.4651 0.2308 MSR AI Frontiers
LRC-Huawei 0.406 0.5283 0.4302 0.0769 Huawei
xManus 0.4061 0.8113 0.2791 0.0000 OpenManus

系统架构

本开源项目基于JoyAgent-JDGenie产品开源了整体的产品界面、智能体的多种核心模式(react模式、plan and executor模式等)、多个子智能体(report agent、search agent等)以及多整体间交互协议。

主要特点和优势

  • 端到端完整的多智能体产品,开箱即用,支持二次开发
  • 智能体框架协议
    • 支持多种智能体设计模式
    • 多智能体上下文管理
    • 高并发DAG执行引擎,极致的执行效率
  • 子智能体和工具
    • 子Agent和工具可插拔:预制多种子智能体和工具
    • 多种文件交付样式:html、ppt、markdown
    • plan和工具调用 RL优化迭代
    • 全链路流式输出

主要创新点

multi-level and multi-pattern thinking:结合多种智能体设计模式支持多层级的规划和思考

  • multi-level:work level 和 task level
  • multi-pattern:plan and executor模式和react模式

cross task workflow memory:跨任务级别的相似任务memory

tool evolution via auto-disassembly-and-reassembly of atom-tools

  • 基于已有工具迭代产生新工具,而不是从0-1直接生成新工具(减少错误工具的生成)
  • 基于已有工具隐性拆解为原子工具,并基于原子工具结合大模型自动组合成新工具(不需要花费人力预先定义和拆解原子工具)

相关推荐

FinGenius

FinGenius

<p>FinGenius 是全球首个A股AI金融博弈智能体应用。FinGenius基于多Agent博弈架构,模拟市场参与者行为,用16个超级智能体(如舆情、游资、风控等)分工协作,快速生成精准的金融分析报告。FinGenius 引入博弈论优化决策,结合“年轮记忆规则算法”记录用户投资习惯,提供个性化分析。FinGenius 支持用AI重塑金融分析,提升决策效率,为投资者和金融机构提供创新解决方案。</p> <h2 style="font-size: 20px;">FinGenius 的主要功能</h2> <ul> <li>多Agent博弈系统:多个专业智能体(如舆情、游资、风控等)分工协作,从不同角度分析市场数据,生成综合报告。模拟市场参与者互动,优化决策过程,预测市场走势。</li> <li>深度数据整合与报告生成:整合多种数据源,快速生成结构化多模态报告,提炼关键信息和风险点。</li> <li>实时数据处理:毫秒级处理海量金融数据,实时监控市场异常,提前识别潜在风险。</li> <li> <div class="paragraph">风险预警系统:实时监控市场异常,提前识别潜在风险,为金融分析提供安全保障。</div> </li> <li>MCP智能调用与工具集成:基于 Model Context Protocol (MCP),实现模型间无缝协作,支持即插即用的金融工具生态。</li> </ul> <h2 style="font-size: 20px;">FinGenius的官网地址</h2> <ul> <li>官网地址: <a href="http://fingenius.cn/" target="_blank" rel="noopener">http://fingenius.cn/</a> </li> <li>GitHub仓库: <a href="https://github.com/HuaYaoAI/FinGenius" target="_blank" rel="noopener">https://github.com/HuaYaoAI/FinGenius</a> </li> </ul>

Magentic-UI

Magentic-UI

<p>这个工具不仅可以自动浏览网页、填写表单,还能执行代码、分析文件,关键是整个过程完全透明可控。</p> <h3 style="font-size: 18px;">主要功能</h3> <p>协同规划:通过对话和计划编辑器,与 AI 一起制定详细的任务执行步骤。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/07/17/1752698732_X5FoB00Ns1.png"></p> <p>协同任务执行:可以随时中断和引导任务执行,直接通过网页浏览器或对话进行干预。</p> <p>敏感操作保护:对于关键操作,系统会主动请求用户确认后再执行。</p> <p>计划学习和检索:从之前的运行中学习经验,改进未来的任务自动化,并保存到计划库中。</p> <p>并行任务处理:支持同时运行多个任务,状态指示器会提醒何时需要输入或任务完成。</p> <p>多模态交互:支持文本消息和图片附件,提供丰富的交互体验。</p>

Pokee AI

Pokee AI

<p>Pokee AI 是下一代通用 AI Agent 开发平台。平台基于强化学习(RL)技术构建高效、个性化且交互性强的 AI Agent,替代传统大语言模型进行任务规划和工具调用。Pokee AI 的 Agent 在多步骤任务执行、推理和工具使用方面表现出色,能快速响应用户指令、提供精准服务,适用于电商、开发与创作、企业自动化等多个领域,基于个性化服务与用户建立长期绑定关系,推动 AI 在更多场景中的落地应用。</p> <h2 style="font-size: 20px;">Pokee AI的官网地址</h2> <ul> <li>官网地址:<a class="external" href="https://pokee.ai/?utm_source=ai-bot.cn" target="_blank" rel="noopener nofollow">pokee.ai</a></li> </ul>

NativeMind

NativeMind

<p>NativeMind是开源的完全在本地设备运行的AI助手。NativeMind支持DeepSeek、Qwen、Llama等多种模型,基于Ollama集成能无缝加载和切换。NativeMind功能包括智能对话、网页内容分析、翻译、写作辅助等,均在浏览器内完成,无需云同步。NativeMind确保数据100%本地处理,无云依赖,无追踪,无日志,让用户完全掌控自己的数据。</p> <h2 style="font-size: 20px;">NativeMind的主要功能</h2> <ul> <li>智能对话:具备多标签页上下文感知能力,进行全面的AI对话,能理解并整合不同页面的信息,让对话更连贯、深入。</li> <li>智能内容分析:能即时总结网页内容,快速提取关键信息;支持理解文档内容,帮助用户快速把握核心要点,节省阅读时间。</li> <li>通用翻译:提供全页翻译功能,支持双语并排显示,方便对比查看;支持对选定文本进行翻译,满足不同翻译需求。</li> <li>AI驱动搜索:增强浏览器的搜索能力,直接在浏览器中输入问题,NativeMind自动浏览网页给出精准答案,提升搜索效率。</li> <li>写作增强:自动检测文本,提供智能改写、校对和创意建议,帮助用户优化写作内容,提高写作质量。</li> <li>实时辅助:在浏览网页时,根据上下文动态显示浮动工具栏,提供相关功能按钮,如翻译、总结等,方便用户随时使用。</li> </ul> <h2 style="font-size: 20px;">NativeMind的项目地址</h2> <ul> <li>项目官网: <a href="https://nativemind.app/" target="_blank" rel="noopener">https://nativemind.app/</a> </li> <li>GitHub仓库: <a href="https://github.com/NativeMindBrowser/NativeMindExtension" target="_blank" rel="noopener">https://github.com/NativeMindBrowser/NativeMindExtension</a> </li> </ul>

Agent Zero

Agent Zero

<p>Agent Zero 是开源的、动态的、可扩展的人工智能框架,成为用户个性化的智能助手。不是预设功能的工具,通过用户的指令和任务动态学习和成长。Agent Zero 具备持久记忆功能,能记住之前的解决方案、代码和事实,以便更快地解决未来任务。将计算机操作系统视为完成任务的工具,可以编写代码并使用终端执行任务,支持多代理协作,能创建下属代理以分解和解决复杂任务。Agent Zero 的行为完全由用户定义的系统提示控制,用户可以通过修改提示文件来定制其行为和功能。支持语音输入和输出,提供实时交互的 Web 界面,用户可以在任何时刻干预代理的行为。</p> <h2 style="font-size: 20px;">Agent Zero的地址</h2> <ul> <li>官网: <a href="https://agent-zero.ai/" target="_blank" rel="noopener">https://agent-zero.ai/</a>  </li> <li>Github仓库: <a href="https://github.com/frdel/agent-zero" target="_blank" rel="noopener">https://github.com/frdel/agent-zero</a> </li> </ul>

飞书Aily

飞书Aily

<p>飞书Aily是飞书推出的企业级Agent平台,类似于企业版的Manus。飞书Aily能深度调用公司内部知识库、任务系统和项目进度,并运行MCP,是真正意义上的企业级智能助手。平台解决了通用Agent无法进入企业内部的问题,因为企业数据安全至关重要,且企业数据大多存储在飞书的云文档、多维表格等系统中。Aily能接入飞书专属MCP,如飞书云文档、飞书项目、飞书任务等,满足企业个性化需求,提升工作效率。</p> <p>飞书Aily官网:https://aily.feishu.cn/</p>

WebSailor

WebSailor

<p>WebSailor 是阿里通义实验室开源的网络智能体,专注于复杂信息检索与推理任务。通过创新的数据合成方法(如 SailorFog-QA)和训练技术(如拒绝采样微调和 DUPO 算法),在高难度任务中表现出色,在 BrowseComp 等评测中超越多个知名模型,登顶开源网络智能体榜单。WebSailor 的推理重构技术能高效处理复杂任务,生成简洁且精准的推理链。在复杂场景中表现出色,在简单任务中展现出强大的泛化能力。</p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">WebSailor 的功能</h2> <a id="user-content-️-features-for-websailor" class="anchor" href="https://github.com/Alibaba-NLP/WebAgent?tab=readme-ov-file#%EF%B8%8F-features-for-websailor" aria-label="永久链接:⛵️ WebSailor 的功能"></a></div> <ul dir="auto"> <li>完整的后训练方法使模型能够进行扩展思考和信息搜索,最终使它们能够成功完成以前被认为无法解决的极其复杂的任务。</li> <li>推出SailorFog-QA,这是一个可扩展的 QA 基准测试,具有较高的不确定性和难度,采用新颖的数据合成方法,通过图形采样和信息混淆进行管理。SailorFog-QA 数据示例可在以下位置找到:<a href="https://github.com/Alibaba-NLP/WebAgent/blob/main/WebSailor/dataset/sailorfog-QA.jsonl"><code>WebSailor/dataset/sailorfog-QA.jsonl</code></a></li> <li>有效的训练后流程包括:(1)从专家轨迹中高质量地重建简洁推理,以进行清晰的监督;(2)一个两阶段的训练过程,涉及 RFT 冷启动阶段,然后是重复采样策略优化 (DUPO),这是一种高效的代理 RL 算法,在有效性和效率方面表现出色。</li> <li>WebSailor-72B 的表现明显优于所有开源代理和框架,同时缩小了与领先专有系统的性能差距,在 BrowseComp-en 上获得了12.0%的得分,在 BrowseComp-zh 上获得了30.1%的得分,在 GAIA 上获得了55.4% 的得分。</li> <li>检查站很快就到了。</li> </ul> <h2 style="font-size: 20px;">WebSailor的项目地址</h2> <ul> <li>Github仓库: <a href="https://github.com/Alibaba-NLP/WebAgent" target="_blank" rel="noopener">https://github.com/Alibaba-NLP/WebAgent</a> </li> <li>论文:<a class="Link--inTextBlock" href="https://arxiv.org/pdf/2507.02592" rel="nofollow">https://arxiv.org/pdf/2507.02592</a></li> </ul>

ML-Master

ML-Master

<p>ML-Master是上海交通大学人工智能学院Agents团队推出ML-Master – 上海交大推出的AI专家Agent的AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色,以29.3%的平均奖牌率位居榜首,超越了微软的RD-Agent和OpenAI的AIDE等竞争对手。ML-Master通过“探索-推理深度融合”的创新范式,模拟人类专家的认知策略,整合广泛探索与深度推理,显著提升了AI在机器学习工程中的表现。采用平衡多轨迹探索和可控推理两大模块,通过自适应记忆机制实现两者的高效协同。</p> <h2 style="font-size: 20px;">ML-Master的项目地址</h2> <ul> <li>项目官网:https://sjtu-sai-agents.github.io/ML-Master/</li> <li>Github仓库:https://github.com/sjtu-sai-agents/ML-Master</li> <li>arXiv技术论文:https://arxiv.org/pdf/2506.16499</li> </ul>

ComputerX

ComputerX

<p>ComputerX是基于人工智能的AI Agent工具,通过自然语言指令帮助用户自动化处理各种计算机任务,提升工作效率。能处理多种任务,如旅行规划、数据分析、报告生成、网页应用创建等,支持文本、表格、图像和代码等多种输出格式。ComputerX基于 AI 技术整合来自多个在线来源的信息,提供全面且准确的结果,保持任务执行过程的透明性。</p> <h2 style="font-size: 20px;">ComputerX的官网地址</h2> <ul> <li>官网地址:<a href="https://computerx.ai/?utm_source=medsci" target="_blank" rel="noopener"> https://computerx.ai/</a></li> </ul>

Miniwork

Miniwork

<p>Miniwork是高效的AI工具平台,聚焦提升工作、学习、内容创作、运营营销等多个方向,专为提升工作与学习效率的用户打造。Miniwork涵盖SEO分析及优化、写作辅助、图像生成、PDF处理、营销策划及运营管理等多元化AI工具,通过前沿技术集成包括GPT-4o、Claude 3.7 sonnet、Gemini 1.5 Flash、Llama 3.1、DeepSeek-R1、GLM-4-plus等在内的多个AI模型。帮助用户应对各类任务场景,提供精准的智能化解决方案,让复杂工作变得简单高效。</p> <h2 style="font-size: 20px;">MiniWork的官网地址</h2> <ul> <li>官网地址: <a href="https://miniwork.ai/en" target="_blank" rel="noopener">https://miniwork.ai/en</a> </li> </ul>

FloweAI

FloweAI

<p>FloweAI是通用型AI Agent,支持基于自然语言指令高效完成各类任务。FloweAI能快速制作PPT、撰写文档、发送邮件、进行深度研究并生成专业报告。FloweAI界面简洁,支持多任务并行处理,具备强大的智能自动化能力,适用学生、职场人士和企业用户。FloweAI能处理日常任务,应对复杂工作流程,基于持续更新和功能扩展,成为用户日常工作和学习中的得力助手。</p> <h2 style="font-size: 20px;">FloweAI的主要功能</h2> <ul> <li>发送邮件:撰写和发送专业邮件。自动跟进对话,管理邮件通信。</li> <li>深度研究:对任何主题进行综合研究。从多个来源收集见解,汇编详细的研究结果。</li> <li>撰写报告:创建专业报告。分析数据,以清晰、结构化的文档呈现信息。</li> <li>制作演示文稿:设计引人入胜的演示文稿。</li> <li>多任务处理:支持多任务并行处理,支持关闭选项卡后台运行,或设置特定时间自动运行任务。</li> <li>文档生成:自动生成Google Docs文档。</li> <li>网页浏览与自动化:自主浏览网页、自动填写网页表格。</li> </ul> <h2 style="font-size: 20px;">FloweAI的官网地址</h2> <ul> <li>官网地址: <a href="https://floweai.com/" target="_blank" rel="noopener">https://floweai.com/</a> </li> </ul>

Jenius

Jenius

<p>Jenius 是天聚地合(苏州)科技股份有限公司推出的通用型AI Agent产品。通过多智能体协作架构,将复杂任务分解为多个子任务,由不同的智能体分工完成,例如规划、执行和验证等。模仿了人类处理任务的逻辑,能高效地完成从需求理解到任务执行的全链路闭环操作。Jenius 整合了近千种实时数据接口,涵盖汇率、天气、新闻等多种数据源,结合用户偏好和历史行为,生成高性价比的解决方案。通过 RPA 技术实现自动化操作,例如自动完成旅行预订或报表生成等任务。Jenius 具备自适应学习能力,能根据用户反馈不断优化流程,提供个性化服务。</p>

HiAgent

HiAgent

<p>HiAgent 是字节跳动推出的面向企业级客户的人工智能应用开发平台。帮助企业快速开发大模型应用和智能体(Agent),满足企业对数据安全和隐私的要求。通过低代码开发工具,HiAgent 降低了开发门槛,非技术背景的业务人员也能轻松上手,快速构建和部署 AI 应用。HiAgent 提供了丰富的行业模板和私有化部署选项,能满足不同企业的个性化需求。支持与企业现有系统的深度集成,帮助企业实现复杂流程的自动化和智能化。</p> <div class="banner-des-text_91704 banner-des-text-light_91704">HiAgent基于Agent DevOps理念,提供智能体开发、评测、观测、优化全生命周期管理,支持模型接入、推理、精调及私有化集成,助力企业高效构建生产级高价值智能体,实现从模型到应用的全链路打通。</div> <h2 style="font-size: 20px;">HiAgent的主要功能</h2> <ul> <li> <div class="paragraph">全生命周期管理:涵盖策略规划、能力开发、效果评测、应用发布、线上观测和持续调优等环节,帮助企业高效构建和管理生产级智能体。</div> </li> <li> <div class="paragraph">低代码开发:提供低代码可视化编排工具,业务人员可通过图形界面快速构建智能体或工作流,内置多种提示词模板和行业应用模板。</div> </li> <li> <div class="paragraph">模型接入与支持:内置火山引擎「豆包」系列模型,并支持第三方大模型接入及混合部署。</div> </li> <li> <div class="paragraph">知识库管理:内置企业知识库功能,支持高级检索增强生成(Advanced RAG),可实现上下文“记忆”,确保回答的准确性和时效性。</div> </li> <li> <div class="paragraph">多模态支持:支持文本对话、图像生成、语音合成/识别等多种模态,适配丰富场景。</div> </li> <li> <div class="paragraph">丰富的插件中心:提供100+企业业务插件,覆盖新闻检索、办公工具、图像识别等领域,支持自定义插件。</div> </li> <li> <div class="paragraph">安全与部署:支持公有云托管、混合云部署和本地私有化部署,具备完善的数据防护机制,确保数据安全。</div> </li> <li> <div class="paragraph">团队协作:支持多用户工作空间和多角色权限管理,满足企业协同开发和管理需求。</div> </li> </ul> <h2 style="font-size: 20px;">HiAgent的官网地址</h2> <ul> <li>官网地址: <a href="https://www.volcengine.com/product/hiagent" target="_blank" rel="noopener">https://www.volcengine.com/product/hiagent</a> </li> </ul>

Teamo

Teamo

<p>Teamo是夕小瑶团队推出的创新的多Agent协作AI生产力平台。通过模拟真实团队协作,由CEO Agent指挥多个专业Agent(如搜索员、咨询顾问、写作员等)协同工作,高效完成复杂任务。核心功能是“超级搜写”,能快速理解用户需求,深度调研信息,生成高质量的文稿。Teamo采用Agent2Agent(A2A)协作模式,可自主调度全球AI模型,通过并行工作和协同竞争,打破传统AI的局限。适用于科研、金融、媒体等多个领域,能快速产出如综述论文、商业策划等复杂内容。</p> <h2 style="font-size: 20px;">Teamo的主要功能</h2> <ul> <li> <div class="paragraph">超级搜写功能:是Teamo的核心功能,能快速理解用户的复杂需求,进行全网深度信息检索与筛选,并将分析后的洞察组织成逻辑清晰、语言流畅的专业文稿。</div> </li> <li>多Agent协作模式 <ul> <li> <div class="paragraph">CEO Agent指挥体系:Teamo的核心在于其独创的“CEO Agent”指挥专业Agent协同工作的模式。CEO Agent作为团队的总指挥,负责理解用户的复杂需求,将任务拆解并分配给不同领域的专业Agent,如搜索员、咨询顾问、写作员、设计师等。</div> </li> <li> <div class="paragraph">Agent角色分工明确:</div> <ul> <li> <div class="paragraph">搜索组长(Search Agent):负责在全网(包括学术数据库、专业报告、新闻媒体等)进行深度信息检索与筛选。</div> </li> <li> <div class="paragraph">咨询组长(Consultant Agent):对收集来的信息进行深度分析、提炼观点、洞察趋势。</div> </li> <li> <div class="paragraph">写作组长(Writer Agent):将分析后的洞察组织成逻辑清晰、语言流畅的专业文稿。</div> </li> <li> <div class="paragraph">美工/研发组长(Designer/Developer Agent):提供排版、设计、数据分析等更多维度的能力支持。</div> </li> </ul> </li> </ul> </li> </ul> <h2 style="font-size: 20px;">Teamo的技术原理</h2> <ul> <li> <div class="paragraph">A2A协议:A2A协议是多Agent协作的核心,实现不同平台、不同厂商之间的智能体协作。支持Agent之间的安全协作、任务状态管理、用户体验协商和功能发现。</div> </li> <li> <div class="paragraph">MCP协议:MCP协议强调“模型+工具+多Agent”的混合协作流,支持意图声明、任务调度、插件封装和状态传递。进一步提升了Agent的自主理解和协作能力。</div> </li> </ul> <h2 style="font-size: 20px;">Teamo的官网地址</h2> <ul> <li>官网地址: <a href="https://teamo.floatmiracle.com/index" target="_blank" rel="noopener">https://teamo.floatmiracle.com/index</a> </li> </ul>

小云雀

小云雀

<p>字节跳动旗下剪映团队近期推出了一款面向短视频创作者、电商营销人员以及普通用户的视频内容创作 Agent,名为「小云雀 AI」,主打“灵感即所得,创作零门槛”。「小云雀AI」已经接入豆包和DeepSeek,目前仅安卓可下载,iOS 预计 6 月发布。</p> <p>不同于传统 AI 工具仅提供一个通用输入框,「小云雀AI」先让用户明确选择场景(如智能成片、数字人视频、AI 设计、AI 换背景等),以此避免生成内容“跑题”,提升了交互效率和结果的相关性。</p> <h2 style="font-size: 20px;">如何使用小云雀</h2> <ul> <li>下载应用:安卓用户访问<a class="external" href="https://sj.qq.com/appdetail/com.commercepro.and" target="_blank" rel="noopener nofollow">腾讯应用宝: https://sj.qq.com/appdetail/com.commercepro.and</a></li> </ul>

Company Research Agent

Company Research Agent

<p>Company Research Agent是基于多智能体框架的公司研究工具,支持一键自动生成全面的公司研究报告。工具从公司网站、新闻文章、财务报告和行业分析等多源数据中收集信息,基于Gemini 2.5 Flash和GPT-4.1-mini等模型进行高语境研究综合及精确的报告格式化和编辑。工具具备AI内容过滤功能,确保信息的相关性和准确性,基于WebSocket实现实时进度流,为用户提供高效、便捷的研究体验。</p> <h2 style="font-size: 20px;">Company Research Agent的主要功能</h2> <ul> <li>多源数据收集:从公司网站、新闻文章、财务报告和行业分析等多种来源收集信息。</li> <li>高语境研究综合:基于 Gemini 2.0 Flash 模型处理和汇总大量数据,生成初始简报。</li> <li>精确报告格式化:用 GPT-4.1-mini 模型进行最终报告的汇编和格式化,确保报告的精确性和一致性。</li> <li>内容过滤与管理:基于 Tavily 的相关性评分系统过滤内容,确保信息的相关性和准确性。</li> </ul> <h2 style="font-size: 20px;">Company Research Agent的项目地址</h2> <ul> <li>项目官网:<a class="external" href="https://companyresearcher.tavily.com/?utm_source=medsci" target="_blank" rel="noopener">https://companyresearcher.tavily.com/</a></li> <li>GitHub仓库:<a class="external" href="https://github.com/pogjester/company-research-agent" target="_blank" rel="noopener nofollow">https://github.com/pogjester/company-research-agent</a></li> </ul>

星辰心流

星辰心流

<p>心流是阿里巴巴推出的基于星辰大模型的AI搜索助手,通过智能技术提升用户的知识获取效率。集成了近3000万篇学术论文资源,覆盖Nature、IEEE、ArXiv等权威期刊,支持学术问答、AI精读、段落总结、智能翻译和名词解释等功能,能帮助研究人员和学生快速理解和分析论文内容。心流提供DeepSeek渠道,联网搜索协助思考过程,具备通用问答、慢推理、私人知识库等功能,适用于市场调研、文档分析、内容创作等多种场景。用户可以通过网页版、手机APP或Chrome浏览器插件使用心流,享受高效、智能的知识管理体验。</p> <h2 style="font-size: 20px;">心流的主要功能</h2> <ul> <li> <div class="paragraph">AI智能搜索与问答</div> <ul> <li> <div class="paragraph">通用问答:支持广泛的问答需求,包括市场调研、活动总结、文档分析等。心流的回答会展示搜索来源,使答案更可信。</div> </li> <li> <div class="paragraph">慢推理:针对复杂问题,支持多轮思考和深度分析,帮助用户进行辩证性思考。</div> </li> <li> <div class="paragraph">学术问答:集成近3000万篇学术论文资源(包括Nature、IEEE、ArXiv等),支持AI精读、段落总结、智能翻译和名词解释。</div> </li> </ul> </li> <li> <div class="paragraph">学术研究辅助</div> <ul> <li> <div class="paragraph">论文资源:提供丰富的学术论文资源,无需下载即可直接阅读。</div> </li> <li> <div class="paragraph">AI辅助阅读器:支持长文本总结、翻译和短文本解释,帮助用户快速理解论文内容。</div> </li> <li> <div class="paragraph">引用跳转:点击论文中的引用标志,可直接显示引用论文的摘要。</div> </li> <li> <div class="paragraph">论文精读功能:用户可以通过选中段落,调用AI能力进行总结、翻译或解释,并将结果保存到笔记中。</div> </li> </ul> </li> <li> <div class="paragraph">知识管理与创作辅助</div> <ul> <li> <div class="paragraph">私人知识库:用户可以上传自己的文献或文档,心流会根据这些内容进行针对性搜索和分析,提升文献阅读效率。</div> </li> <li> <div class="paragraph">笔记功能:用户可以保存AI生成的内容到笔记中,方便随时查看和回顾。</div> </li> <li> <div class="paragraph">内容创作辅助:支持生成播客内容,将文字答案转化为双人对话模式的播客,使内容更生动。</div> </li> </ul> </li> <li class="paragraph">答案生成播客:将文字内容转化为播客,适合不想阅读文字的用户。</li> <li class="paragraph">心流模式:提供无线画布设计,适合汇报或头脑风暴场景。</li> <li class="paragraph">连网搜索:通过DeepSeek渠道,结合联网搜索协助用户思考。</li> </ul> <h2 style="font-size: 20px;">如何使用心流</h2> <ul class="text-md"> <li>访问平台:访问星辰心流的官网 <a href="https://iflow.cn/" target="_blank" rel="noopener">iflow.cn</a></li> </ul>

Operator

Operator

<p>Operator是OpenAI推出的首款AI智能体。能像人类一样操作网页浏览器的AI工具,可以自动完成各种在线任务,如预订餐厅、购买机票、填写表单等。Operator基于Computer-Using Agent(CUA)的新模型驱动,模型结合了GPT-4o的视觉能力和强化学习的高级推理能力。通过屏幕截图“观察”网页,使用虚拟鼠标和键盘进行操作。Operator目前处于研究预览阶段,仅对美国的ChatGPT Pro用户开放。未来,OpenAI计划将其扩展到更多用户群体,并集成到ChatGPT中。</p> <p><img src="https://img.medsci.cn/aisite/img//4KBMjmOPNmU5cSLBwi1osey2GgAMZVtXnzOFGkU2.png"></p> <h2 style="font-size: 20px;">Operator的主要功能</h2> <ul> <li>自动化任务执行:Operator能自动完成多种在线任务,如预订餐厅、购买机票、在线购物、填写表单等。</li> <li>多任务处理:支持同时运行多个任务,例如在不同网站上预订旅行和购物。</li> <li>个性化设置:用户可以设置偏好(如首选航空公司)并保存常用任务,以便快速执行。</li> <li>自我纠错与推理能力:在遇到问题时,Operator能通过推理自我调整,若无法解决则交还用户控制。</li> <li>安全与隐私保护:在涉及敏感信息(如登录、支付)时,Operator会请求用户接管,拒绝执行高风险任务。</li> </ul> <h2 style="font-size: 20px;">Operator的技术原理</h2> <ul> <li>Computer-Using Agent (CUA)模型:模型结合了GPT-4o的视觉识别能力和通过强化学习获得的高级推理能力。Operator能理解和交互图形用户界面(GUI),像人类用户一样操作网页。 <ul> <li>感知(Perception):Operator通过屏幕截图获取当前界面的信息。使用GPT-4o的视觉能力分析截图,识别界面元素如按钮、菜单和文本框。</li> <li>推理(Reasoning):基于强化学习的推理能力,Operator规划下一步操作。通过“内心独白”机制,评估观察结果、跟踪中间步骤并动态调整。</li> <li>行动(Action):执行操作,如点击、滚动或键入。在任务完成或需要用户输入时停止操作。</li> </ul> </li> <li>视觉能力:Operator通过屏幕截图“看到”网页内容。识别和理解GUI元素,无需依赖特定操作系统或网络API。</li> <li>强化学习:通过强化学习,Operator获得高级推理能力。能自我纠错,当遇到挑战或犯错时,可以基于推理能力进行自我调整。</li> <li>自我纠错与学习:在执行任务过程中,如果出现错误,Operator能检测到问题所在。通过重新尝试或提示用户确认,Operator能纠正错误。</li> </ul> <h2 style="font-size: 20px;">如何使用Operator</h2> <ul> <li>Operator的官方网站: <a href="https://operator.chatgpt.com/" target="_blank" rel="noopener">https://operator.chatgpt.com/</a> </li> </ul>