梅斯医学AI智能体,有超过40款不同的智能体,同时支持多国语言

相关推荐

Lovart

Lovart

<h1>Lovart 全球首个设计 Agent 体验</h1> <section><span data-pm-slice="1 1 ["para",{"tagName":"p","attributes":{"style":"font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-align: start;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-size: 15px;line-height: 2em;font-family: \"PingFang SC\", system-ui, -apple-system, BlinkMacSystemFont, \"Helvetica Neue\", \"Hiragino Sans GB\", \"Microsoft YaHei UI\", \"Microsoft YaHei\", Arial, sans-serif;color: rgb(31, 35, 41);margin: 0px 0px 4px;word-break: break-all;min-height: 20px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":"color: rgb(31, 35, 41);"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">Lovart 的三个特点:</span></section> <h3>一、全链路设计和执行,一句话搞定</h3> <p>以前的文生图工具,它们所提供的任务是“生成图片”这一环。</p> <p>而设计 Agent,则像一位“设计执行官”,覆盖从创意拆解到专业交付的整个视觉流程。</p> <p>从意图拆解 → 任务链 → 最后成品,一句话全搞定。</p> <p>单次可以执行上百步,最多可以一次产出40张设计成品图。</p> <p>比如,我可以让它根据我家猫的照片做一套银渐层表情包,它会自己设计表情,挨个生图,还可以全部编辑,一键做出所有表情包的黑底渐变色版本。</p> <p> </p> <section><img class="qnt-img-img qnr-img-lazy-load-img" src="https://inews.gtimg.com/om_bt/ORPkpWhOF_KMtPcoydMfk6zoBDmmg3KCqFlEd7j2vFDVIAA/1000" alt="图片" data-src="https://inews.gtimg.com/om_bt/ORPkpWhOF_KMtPcoydMfk6zoBDmmg3KCqFlEd7j2vFDVIAA/1000"></section> <p>Prompt:</p> <p>Use the cat in this picture as a template to design a set of 12 silver gradient emoji packs. Style 3D cartoon, to express the most popular and trendy emoji this year.</p> <p> </p> <p>再比如,为宣传智能家居扬声器的 30 秒视频广告创建一个 6 帧故事板。</p> <p>它会先根据需求,写出故事,然后开始进行角色设计。</p> <p>完成之后,会进行关键场景的设计。</p> <p>在最后把场景填充到故事板里,为每个画面配上光线、摄影机移动等信息。</p> <p><img class="qnt-img-img qnr-img-lazy-load-img" src="https://inews.gtimg.com/om_bt/G2tapNA9henwcYDaY6W7SIIYNY93t5vys-950CiJWwTkcAA/0" alt="图片" data-src="https://inews.gtimg.com/om_bt/G2tapNA9henwcYDaY6W7SIIYNY93t5vys-950CiJWwTkcAA/0"></p> <p data-pm-slice="0 0 []">Prompt:</p> <p>Create a 6-frame storyboard for a 30-second video ad promoting a smart home speaker.</p> <p>Scene progression:</p> <p>Modern living room, family interacting</p> <p>Voice command to the speaker</p> <p>Music starts playing</p> <p>Speaker answers a question</p> <p>Lighting adjusts automatically</p> <p>Close-up of product and brand tagline</p> <p>Style: clean, semi-realistic illustration, soft light.</p> <p> </p> <h3>二、图像视频音乐,自由调度</h3> <p>只有具备了充足的工具箱,<span data-pm-slice="1 1 ["para",{"tagName":"p","attributes":{"style":"font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-align: start;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-size: 15px;line-height: 2em;font-family: \"PingFang SC\", system-ui, -apple-system, BlinkMacSystemFont, \"Helvetica Neue\", \"Hiragino Sans GB\", \"Microsoft YaHei UI\", \"Microsoft YaHei\", Arial, sans-serif;color: rgb(31, 35, 41);margin: 0px 0px 4px;word-break: break-all;min-height: 20px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":"color: rgb(31, 35, 41);"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">Agent 才能更全面地完成任务。</span></p> <p>Lovart 集成了一系列前沿的 AI 模型,比如 GPT image-1, Flux pro, OpenAI-o3, Gemini Imagen 3, Kling AI, Tripo AI, Suno AI等。</p> <p>设计师可以在一个统一的界面内完成设计、编辑与生成,再也不必在多个软件和模型之间来回切换。</p> <p>我让它设计一个 "VIVIDPIX "的新生活科技品牌,并创建跨媒体发布活动。</p> <p>它不仅设计了logo、海报、周边,还用可灵制作了3D版本的logo动画,用suno制作了bgm。</p> <p>由于所有的模型都拥有相同的 Context 上下文,配合起来丝滑无缝。</p> <section><img class="qnt-img-img qnr-img-lazy-load-img" src="https://inews.gtimg.com/om_bt/GCAo0LAx9FNM5OxMeFJpzbuSnyZ4legCKsC_oEMyW6mHcAA/0" alt="图片" data-src="https://inews.gtimg.com/om_bt/GCAo0LAx9FNM5OxMeFJpzbuSnyZ4legCKsC_oEMyW6mHcAA/0"></section> <p>Prompt:</p> <p data-pm-slice="0 0 []">Prompt:</p> <p>Create a cross-media launch campaign for a new lifestyle tech brand called “VIVIDPIX”.</p> <p>Visuals: Design two main brand posters in different styles (futuristic minimalism and playful retro), including editable text layers and logo integration.</p> <p>Video/3D: Generate a dynamic 10-second video loop of the brand logo morphing in 3D space, with smooth, modern animation, suitable for website and social sharing. Leverage Kling or equivalent video/animation AI tools.</p> <p>Music: Compose an original 15-second catchy theme music that matches the brand’s energetic and optimistic tone. Use Suno or other advanced AI music models.</p> <p>Packaging: Output a box and product mockup, harmonizing visuals across all touchpoints.</p> <p>Canvas: Bring all assets together onto a single editable Lovart canvas, allowing for integrated fine-tuning and end-to-end brand asset delivery.</p> <p>All elements—visuals, video, music, packaging—should have a cohesive color palette and brand personality, and be ready to use for a multi-platform product launch.</p> <p> </p> <h3>三、生成结果自动分图层,随心修改</h3> <p>在海报的生成中,最大的痛点是文字后期的编辑,Lovart 很好地解决了这一痛点。</p> <p>举例来说,我这里要为一种新的植物蛋白饮料设计一张宣传海报。</p> <p>一分钟后,它就生成了左侧的标准海报,同时在右侧附上了图文分离的版本。</p> <p>现在我可以自由修改文字的内容、大小、颜色,真的太方便了。</p> <section><img class="qnt-img-img qnr-img-lazy-load-img" src="https://inews.gtimg.com/om_bt/GzxWhUIVamAgAR50Ayk23PIkiTk6CwOeHZ3-GL7UhzA9EAA/0" alt="图片" data-src="https://inews.gtimg.com/om_bt/GzxWhUIVamAgAR50Ayk23PIkiTk6CwOeHZ3-GL7UhzA9EAA/0"></section> <p data-pm-slice="0 0 []">Prompt:</p> <p>Design a promotional poster for a new plant-based protein drink.</p> <p>Style: vibrant and energetic, modern editorial layout.</p> <p>Color palette: green, cream, and orange.</p> <p>Text: “Fuel Your Day, Naturally”.</p> <p>Aspect ratio: 3:4, for Instagram feed.</p> <p>Include editable text layers.</p> <p> </p> <h2>使用小技巧:</h2> <p>在使用 Lovart 的过程中也发现了一些小心得,在这里分享给大家:</p> <ol class="list-paddingleft-1"> <li> <section>1. Lovart 内置了很多图像、视频、音乐模型,但并不是每个模型都对中文支持够好,所以使用英文进行提示词会获得最佳体验。</section> </li> <li> <section>2. 设计的起点是需求,只有把需求描述好,Agent 才能设计好,所以建议在发布任务之前,先和 AI 聊一下需求,让 AI 输出最后的提示词。提示词里可以包含风格、颜色、文字、比例等结构化信息,结构化信息本身是对复杂需求的一种拆解,这样写出来的提示词,Lovart 在执行的时候效果也最好。</section> </li> <li> <section>3. 如果需要独立的文字图层,只需要在指令中加上这句话即可: Include editable text layers.</section> </li> </ol> <p> </p> <h2>结语</h2> <p>Lovart 的出现,代表 AI 在设计领域的角色,正在从单纯的“图像生成器”向更深层次的“设计执行官”转变。</p> <p>它试图解决的,不仅仅是“画出一张图”,更是“完成一个设计任务”的问题。</p> <p> </p> <p>有人曾问我,4o 生图的出现是否会干掉图像的工作流。</p> <section>我所看到的情况,不是干掉,而是解放。</section> <section>这种解放,将图像工作流推向设计 Agent 的新范式。</section> <section></section> <section>技术的发展总是在不断挑战我们的想象边界。</section> <p>当 AI Agent 开始尝试理解并执行更复杂的设计流程时,</p> <p>我们与 AI ,<span data-pm-slice="0 0 []">也将迎来全新的</span>协作方式。</p>

OpenManus

OpenManus

超级智能体,平替Manus

Simular AI

Simular AI

Agent S2:一个开放、模块化、可扩展的计算机使用智能体框架

agent.exe

agent.exe

我想看看 Claude 新的计算机API 有多好用,但他们提供的默认项目感觉太过笨重。这是一个简单的 Electron 应用,可以让 Claude 3.5 Sonnet 直接控制你的本地计算机。我原本计划添加一个“半自动”模式,让用户在执行每个操作之前确认,但每个步骤都太慢了,我觉得这完全没必要。如果模型出现问题,你只需点击“停止”按钮即可结束运行。

orence潮汐AI

orence潮汐AI

潮汐AIGC问答系统,聚合多模态大模型、知识库、插件和工作流等 Agent 构建能力,致力于为用户提供 LLM 大语言模型落地应用的强大在线平台。 新版本采用 Gin + Vite5 TypeScript Vue3 技术栈,拥有极致的响应速度;在更简洁的界面下保留完整功能,拥有更多的细节但是更加轻量化,拥有新的UI及交互方式,内置6组不同风格的显示效果,以及更流畅的使用体验。 AI对话:(OPENAI、讯飞星火、百度文心、智谱清言、通义千问、腾讯混元、Kimi全系列模型)以及更多自定义模型如deepseek、claude、bing、llama3、gemini、stable-diffusion、suno-v3、DALL-E3等兼容OPENAI API的模型; AI绘画:DALL-E3 Midjourney Flux; AI写作:思维导图、小应用助手、写作、PDF对话; AIPPT:对话式创作演示文稿; WorkFlow:一站式AI智能体搭建平台,支持AI Agent智能对话机器人; 插件:支持联网搜索丨文件问答丨 URL解析丨图像识别丨HTML代码运行等; 支付:支付宝、微信、易支付 登录:邮箱、短信验证、QQ、微信 客户端:Android iOS Windows MacOS支持

Thinkeo

Thinkeo

Thinkeo 提供了一个可定制的 AI 平台,利用多个 AI 智能体协同工作来创建复杂的文档。这些智能体通过从各种来源收集信息来管理整个文档创建过程。然后,它们生成结构化的报告或文档。 Thinkeo 适用于市场分析或技术摘要等任务。它还能处理复杂的行政和监管文书工作。该系统能够理解特定的合规规则和框架,确保资金申请等文件符合要求。Thinkeo 致力于确保输出结果的一致性和准确性。 它使用多个 AI智能体协作创建文档。 自动化从数据收集到最终输出的整个工作流程。 处理来自不同来源的数据以生成全面的报告。 处理需要合规性的复杂行政文件。

AgentLed AI

AgentLed AI

AgentLed AI 使用协作代理实现无需编码的工作流自动化。它具有“执行智能体”功能,用于监督业务运营。这些代理会分析数据,为决策提供依据并提出改进建议。用户可以使用简单的英语命令构建自动化序列。 代理一旦设置完成即可自主运行,设定月度目标并执行相关任务。该系统包含持续学习功能,可随着时间的推移不断完善策略。AgentLed AI 致力于提高整体业务效率和增长,帮助企业从 AI 试验走向更广泛的应用。 使用简单的英语指令构建 AI 驱动的工作流。 具有执行智能体功能,用于运营监督和分析。 智能体可以自主设定目标、执行任务并进行学习。 创建集成到业务流程中的多步骤工作流。

Globus AI

Globus AI

Globus AI 专注于劳动力管理自动化。其 AI 代理有助于人才参与和职位安排。代理会自动读取并排序空缺职位,从而减少招聘经理的手动数据处理。Globus AI 能够快速将候选人与合适的职位匹配。 它采用自由文本分析,而非复杂的关键词系统。Globus AI 可以简化面试安排和职位安排的流程。人才可以通过简单的浏览器界面访问和接受职位。每次互动都有助于 AI 改进未来的匹配效果,最终目标是提高职位安排效率和员工满意度。 自动读取、排序空缺职位并确定其优先级。 使用文本分析快速将候选人与职位匹配。 简化经理和人才的排班和协调工作。 利用互动数据优化未来的推荐。

CortexON AI

CortexON AI

CortexON AI 是一款开源 AI 智能体。它旨在思考并自动化常见任务,与许多商业方案不同,其代码公开可用。这种方法强调数据的透明度和用户控制。用户可以查看代理的工作原理并进行修改。 CortexON 专注于执行自主决策。它可以满足不同领域的不同自动化需求。其重点在于确保每个人都能轻松访问并适应,同时企业保留对其信息的完全所有权。 提供对其代码库的完全访问权限,以实现透明度。 能够独立决策和任务自动化。 确保用户掌控自己的数据隐私。 公开构建,欢迎社区提出想法和贡献。

Supervity AI

Supervity AI

Supervity AI 提供一套旨在提升业务效率的智能体。该平台作为公司知识的中心枢纽,根据内部文档提供精准的答案。智能体可以连接上千种不同的软件应用程序,管理涉及多个步骤的工作流程,从而实现现有业务系统的自动化。 用户无需编写代码即可构建自动化流程。名为“协同浏览 AI”的功能可实时指导员工使用软件,同时另一位智能体可以安全自然地处理客户对话。Vision AI 智能代理通过查看图像和视频来获取洞察,财务部门则利用它们来加快发票处理速度。 集中公司知识,快速获得参考答案。 管理跨多个软件平台的复杂任务。 提供数字化工具采用的实时指导。 分析可视化数据以发现模式或问题。

Suna

Suna

Suna 是一款完全开源的 AI 助手,可帮助您轻松完成实际任务。通过自然对话,Suna 将成为您进行研究、数据分析和应对日常挑战的数字伙伴——它结合了强大的功能和直观的界面,能够理解您的需求并为您提供帮助。 Suna 强大的工具包包括:无缝的浏览器自动化功能(用于网页导航和数据提取)、文件管理功能(用于文档创建和编辑)、网页爬取和扩展搜索功能、命令行执行系统任务、网站部署以及与各种 API 和服务的集成。这些功能协同工作,使 Suna 能够通过简单的对话解决您的复杂问题并实现工作流程自动化!

UFO²

UFO²

微软开放的桌面智能体,The Desktop AgentOS.

xinxiang-心响

xinxiang-心响

心响是一个通用超级智能体,用户仅需一句话即可一键完成复杂任务。接收用户需求后,心响App能像「AI指挥官」一样下达命令,先将用户提出的复杂需求拆解成一系列子任务,然后通过自主规划与多智能体协作,调度多个领域智能体、使用多种工具解决问题,确保任务分解到位、执行有力,最终交付与用户需求契合的成果。 无论是在例行任务、智慧图表、深度研究、法律咨询等工作场景上,还是在摸鱼游戏、试题讲解、城市旅游、AI相亲、健康咨询等生活场景上,心响App都能高效满足用户的多样化需求,还提供了图文、视频、PDF文件、交互式网页应用等多种交付形态。它不仅集成了搜索、网页浏览、代码执行器、网页部署等工具,还能自主学习,不断提升产品效果与交付体验,让用户从复杂任务中得到解放,轻松“坐享其成”。

STORM and Co-Storm

STORM and Co-Storm

斯坦福大学在AI辅助学术研究领域取得了重大进展,他们的开源工具STORM进化后新增了协作对话机制Co-STORM。这一先进功能使得AI实体能够参与圆桌讨论,模拟人类般的互动。Co-STORM通过整合多个AI专家和一个主持人,在几分钟内生成关于特定主题的深入、经过充分研究的文章,同时具备跟踪和参与对话的能力,通过动态思维导图展示。该工具生成具有多元视角的详细报告,并且可在线免费获取,对研究人员和学生来说是一项值得关注的发展。 Co-STORM框架及其对学术研究的影响已被EMNLP 2024主要会议认可,突显了其对学术写作和信息发现未来的潜在影响。- 斯坦福大学推出了一款名为STORM的工具,利用大语言模型(LLM)辅助编写类维基百科文章。 - STORM可以将输入的主题转换为长篇文章或研究论文,并以PDF格式下载。 - STORM通过检索、多角度提问和模拟专家对话等方式生成写作大纲和内容报告。 - STORM擅长需要大量研究和引用的写作任务。 - STORM的GitHub上的Star量已经超过了24k。 - STORM团队推出了全新功能Co-STORM,引入了协作对话机制和轮次管理策略。 - Co-STORM包括Co-STORM LLM专家、主持人和人类用户。 - Co-STORM模拟用户、观点引导专家和主持人之间的协作对话。 - Co-STORM的评估结果表明其在报告质量和对话质量方面优于基线模型。 - Co-STORM的主持人角色可以根据未使用信息提出问题,帮助用户发现更多信息。 - Co-STORM可以帮助用户找到与目标相关的更广泛、更深层次的信息。 STORM 认为研究过程自动化的核心是自动提出好的问题。直接提示语言模型提出问题效果并不好。为了提高问题的深度和广度,STORM 采用了两种策略: 观点引导提问:给定输入主题,STORM 通过调查类似主题的现有文章来发现不同的观点,并使用它们来控制提问过程。 模拟对话:STORM 模拟维基百科作者和基于互联网资源的主题专家之间的对话,使语言模型能够更新其对主题的理解并提出后续问题。 斯坦福又推出了STORM的升级版 ——Co-STORM,引入了协作对话机制,并采用轮次管理策略,实现了AI 智能体间的圆桌讨论和流畅的协作式 AI 学术研究。

UI-TARS

UI-TARS

UI-TARS-1.5 是一款基于强大的视觉语言模型构建的开源多模态代理,能够在虚拟世界中高效地执行各种任务。 UI-TARS-1.5 这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。 UI-TARS-1.5 基于字节此前提出的原生智能体方案 UI-TARS,通过强化学习进一步增强了模型的高阶推理能力,使模型能够在“行动”前先进行“思考”。 该版本的模型中,团队还展示了一个新的愿景:以游戏为载体来增强基础模型的推理能力。与数学、编程等领域相比,游戏更多依赖直观的、常识性的推理,并较少依赖专业知识,因此,游戏通常是评估和提升未来模型通用能力的理想测试场景。 据介绍,UI-TARS 是一个原生 GUI 智能体,具备真实操作电脑和手机系统的能力,同时,还可操控浏览器、完成复杂交互任务。UI-TARS-1.5 能够实现精准 GUI 操作,基于团队在四个维度的技术探索: 视觉感知增强:依托大规模界面截图数据,模型可理解元素的语义与上下文,形成精准描述。 System 2 推理机制:在动作前生成“思维(thought)”,支持复杂任务的多步规划与决策。 统一动作建模:构建跨平台标准动作空间,通过真实轨迹学习提升动作可控性与执行精度。 可自我演化的训练范式:通过自动化的交互轨迹采集与反思式训练,模型持续从错误中改进,适应复杂环境变化。

browser-use

browser-use

Browser Use 是一个AI驱动浏览器自动化开源框架,让我们可以通过自然语言操作浏览器。Browser-use 是一个强大的浏览器自动化框架,它结合了大语言模型(LLM)的能力与浏览器操作,使AI 能够像人类一样浏览网页、填写表单、点击按钮等。目前在 GitHub 上已经获得了惊人的 49.9k star

AutoGPT

AutoGPT

AutoGPT是一个AI agent(智能体),也是开源的应用程序,结合了GPT-4和GPT-3.5技术,给定自然语言的目标,它将尝试通过将其分解成子任务,并在自动循环中使用互联网和其他工具来实现这一目标,它由GPT-4驱动,自主地开发和管理业务。说简单点,你给AutoGPT一个题目,它会自己思考,给出实现的步骤以及实现细节。 与ChatGPT不同的是,用户不需要不断对AI提问以获得对应回答,在AutoGPT中只需为其提供一个AI名称、描述和五个目标,然后AutoGPT就可以自己完成项目。

OpenHands

OpenHands

OpenHands提供强大的兼容性,支持任意大型语言模型(LLM),支持多智能体协作提高开发效率,减少开发者的编码工作量。并且提供了强大的交互机制、安全的沙箱环境、多代理协作能力及全面的评估框架,支持用户实现新代理的开发、安全的代码执行、多代理间的协调及在多种任务上的评估。