Operator

Operator

Operator是OpenAI推出的首款AI智能体。能像人类一样操作网页浏览器的AI工具,可以自动完成各种在线任务,如预订餐厅、购买机票、填写表单等。Operator基于Computer-Using Agent(CUA)的新模型驱动,模型结合了GPT-4o的视觉能力和强化学习的高级推理能力。通过屏幕截图“观察”网页,使用虚拟鼠标和键盘进行操作。Operator目前处于研究预览阶段,仅对美国的Cha

UI-TARS

UI-TARS

UI-TARS-1.5 是一款基于强大的视觉语言模型构建的开源多模态代理,能够在虚拟世界中高效地执行各种任务。 UI-TARS-1.5 这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。 UI-TARS-1.5 基于字节此前提出的原生智能体方案 UI-TARS,通过强化学习进一步增强了模型的高阶推理能力,使模型能够在“行动”前先进行“思考”。 该版本

Thinkeo

Thinkeo

Thinkeo 提供了一个可定制的 AI 平台,利用多个 AI 智能体协同工作来创建复杂的文档。这些智能体通过从各种来源收集信息来管理整个文档创建过程。然后,它们生成结构化的报告或文档。 Thinkeo 适用于市场分析或技术摘要等任务。它还能处理复杂的行政和监管文书工作。该系统能够理解特定的合规规则和框架,确保资金申请等文件符合要求。Thinkeo 致力于确保输出结果的一致性和准确性。

WebThinker

WebThinker

WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(LRMs)在推理过程中自主进行网络搜索、网页导航和报告撰写。WebThinker基于深度网页探索器和自主思考、搜索、写作策略,让LRMs能动态获取信息,实时生成高质量研究报告。WebThinker基于强化学习的训练策略进一步优化工具使用效率。WebThinke

Jenius

Jenius

Jenius 是天聚地合(苏州)科技股份有限公司推出的通用型AI Agent产品。通过多智能体协作架构,将复杂任务分解为多个子任务,由不同的智能体分工完成,例如规划、执行和验证等。模仿了人类处理任务的逻辑,能高效地完成从需求理解到任务执行的全链路闭环操作。Jenius 整合了近千种实时数据接口,涵盖汇率、天气、新闻等多种数据源,结合用户偏好和历史行为,生成高性价比的解决方案。通过 RPA 技术实现

browser-use

browser-use

Browser Use 是一个AI驱动浏览器自动化开源框架,让我们可以通过自然语言操作浏览器。Browser-use 是一个强大的浏览器自动化框架,它结合了大语言模型(LLM)的能力与浏览器操作,使AI 能够像人类一样浏览网页、填写表单、点击按钮等。目前在 GitHub 上已经获得了惊人的 49.9k star

UFO²

UFO²

微软开放的桌面智能体,The Desktop AgentOS.

Clark

Clark

Superblocks 专为全球大型企业打造,旨在以极低的时间和成本构建现代化、安全的软件。世界各地的团队都依赖 Superblocks 来构建关键任务内部应用程序,这些应用程序是其运营的支柱。 此次Superblocks推出首个用于构建企业内部应用的 AI 智能体——Clark。 借助 IT 和工程防护,赋能每位员工安全构建。 执行企业标准:使用您的设计系统、集成、权限等进行构建。 三种

Minion-agent

Minion-agent

minion-agent的开源项目为开发者们提供了一个全新的AI智能体开发框架。 minion-agent的核心价值在于优雅地解决了「框架碎片化」的问题,开发者想要开发一款AI智能体的话,需要在OpenAI、LangChain、Google AI以及SmolaAgents等多种框架间切换,因为每种框架都有其独特的优势和局限性,也是当前AI智能体开发中的主要阻碍。 minion-agent通过提供

WebSailor

WebSailor

WebSailor 是阿里通义实验室开源的网络智能体,专注于复杂信息检索与推理任务。通过创新的数据合成方法(如 SailorFog-QA)和训练技术(如拒绝采样微调和 DUPO 算法),在高难度任务中表现出色,在 BrowseComp 等评测中超越多个知名模型,登顶开源网络智能体榜单。WebSailor 的推理重构技术能高效处理复杂任务,生成简洁且精准的推理链。在复杂场景中表现出色,在简单任务中展

Pokee AI

Pokee AI

Pokee AI 是下一代通用 AI Agent 开发平台。平台基于强化学习(RL)技术构建高效、个性化且交互性强的 AI Agent,替代传统大语言模型进行任务规划和工具调用。Pokee AI 的 Agent 在多步骤任务执行、推理和工具使用方面表现出色,能快速响应用户指令、提供精准服务,适用于电商、开发与创作、企业自动化等多个领域,基于个性化服务与用户建立长期绑定关系,推动 AI 在更多场景中

OpenManus

OpenManus

OpenManus是由MetaGPT社区的成员在短短 3 小时内开发完成的开源版Manus,与 Manus 在云端运行不同,OpenManus 直接在用户本地电脑上运行,让用户能够亲眼目睹 AI 代理如何操控自己的电脑完成各种任务。

Company Research Agent

Company Research Agent

Company Research Agent是基于多智能体框架的公司研究工具,支持一键自动生成全面的公司研究报告。工具从公司网站、新闻文章、财务报告和行业分析等多源数据中收集信息,基于Gemini 2.5 Flash和GPT-4.1-mini等模型进行高语境研究综合及精确的报告格式化和编辑。工具具备AI内容过滤功能,确保信息的相关性和准确性,基于WebSocket实现实时进度流,为用户提供高效、便

Agent Zero

Agent Zero

Agent Zero 是开源的、动态的、可扩展的人工智能框架,成为用户个性化的智能助手。不是预设功能的工具,通过用户的指令和任务动态学习和成长。Agent Zero 具备持久记忆功能,能记住之前的解决方案、代码和事实,以便更快地解决未来任务。将计算机操作系统视为完成任务的工具,可以编写代码并使用终端执行任务,支持多代理协作,能创建下属代理以分解和解决复杂任务。Agent Zero 的行为完全由用户

orence潮汐AI

orence潮汐AI

潮汐AIGC问答系统,聚合多模态大模型、知识库、插件和工作流等 Agent 构建能力,致力于为用户提供 LLM 大语言模型落地应用的强大在线平台。 新版本采用 Gin + Vite5 TypeScript Vue3 技术栈,拥有极致的响应速度;在更简洁的界面下保留完整功能,拥有更多的细节但是更加轻量化,拥有新的UI及交互方式,内置6组不同风格的显示效果,以及更流畅的使用体验。 AI对话

ML-Master

ML-Master

ML-Master是上海交通大学人工智能学院Agents团队推出ML-Master – 上海交大推出的AI专家Agent的AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色,以29.3%的平均奖牌率位居榜首,超越了微软的RD-Agent和OpenAI的AIDE等竞争对手。ML-Master通过“探索-推理深度融合”的创新范式,模拟人类专家的认知策略,整合广泛探索与深度推理,显

FloweAI

FloweAI

FloweAI是通用型AI Agent,支持基于自然语言指令高效完成各类任务。FloweAI能快速制作PPT、撰写文档、发送邮件、进行深度研究并生成专业报告。FloweAI界面简洁,支持多任务并行处理,具备强大的智能自动化能力,适用学生、职场人士和企业用户。FloweAI能处理日常任务,应对复杂工作流程,基于持续更新和功能扩展,成为用户日常工作和学习中的得力助手。 FloweAI的主要功能

Supervity AI

Supervity AI

Supervity AI 提供一套旨在提升业务效率的智能体。该平台作为公司知识的中心枢纽,根据内部文档提供精准的答案。智能体可以连接上千种不同的软件应用程序,管理涉及多个步骤的工作流程,从而实现现有业务系统的自动化。 用户无需编写代码即可构建自动化流程。名为“协同浏览 AI”的功能可实时指导员工使用软件,同时另一位智能体可以安全自然地处理客户对话。Vision AI 智能代理通过查看图像和视

Simular AI

Simular AI

Agent S2:一个开放、模块化、可扩展的计算机使用智能体框架

NativeMind

NativeMind

NativeMind是开源的完全在本地设备运行的AI助手。NativeMind支持DeepSeek、Qwen、Llama等多种模型,基于Ollama集成能无缝加载和切换。NativeMind功能包括智能对话、网页内容分析、翻译、写作辅助等,均在浏览器内完成,无需云同步。NativeMind确保数据100%本地处理,无云依赖,无追踪,无日志,让用户完全掌控自己的数据。 NativeMind的主要功

STORM and Co-Storm

STORM and Co-Storm

斯坦福大学在AI辅助学术研究领域取得了重大进展,他们的开源工具STORM进化后新增了协作对话机制Co-STORM。这一先进功能使得AI实体能够参与圆桌讨论,模拟人类般的互动。Co-STORM通过整合多个AI专家和一个主持人,在几分钟内生成关于特定主题的深入、经过充分研究的文章,同时具备跟踪和参与对话的能力,通过动态思维导图展示。该工具生成具有多元视角的详细报告,并且可在线免费获取,对研究人员和学生

AgentLed AI

AgentLed AI

AgentLed AI 使用协作代理实现无需编码的工作流自动化。它具有“执行智能体”功能,用于监督业务运营。这些代理会分析数据,为决策提供依据并提出改进建议。用户可以使用简单的英语命令构建自动化序列。 代理一旦设置完成即可自主运行,设定月度目标并执行相关任务。该系统包含持续学习功能,可随着时间的推移不断完善策略。AgentLed AI 致力于提高整体业务效率和增长,帮助企业从 AI 试验走向

Magentic-UI

Magentic-UI

这个工具不仅可以自动浏览网页、填写表单,还能执行代码、分析文件,关键是整个过程完全透明可控。 主要功能 协同规划:通过对话和计划编辑器,与 AI 一起制定详细的任务执行步骤。 协同任务执行:可以随时中断和引导任务执行,直接通过网页浏览器或对话进行干预。 敏感操作保护:对于关键操作,系统会主动请求用户确认后再执行。 计划学习和检索:从之前的运行中学习经验,改进未来的任务自动化,并保存到

ComputerX

ComputerX

ComputerX是基于人工智能的AI Agent工具,通过自然语言指令帮助用户自动化处理各种计算机任务,提升工作效率。能处理多种任务,如旅行规划、数据分析、报告生成、网页应用创建等,支持文本、表格、图像和代码等多种输出格式。ComputerX基于 AI 技术整合来自多个在线来源的信息,提供全面且准确的结果,保持任务执行过程的透明性。 ComputerX的官网地址 官网地址: https:

只显示前20页数据