关键词 "HTTP requests" 的搜索结果, 共 24 条, 只显示前 480 条
Rosebud是AI驱动的在线心理健康日记应用,基于互动式日记、习惯养成和情感支持等功能,帮助用户快速改善心理健康。用户能记录日常情绪、设定目标并获得实时反馈。Rosebud的AI技术能识别长期行为模式,为用户提供深度报告和个性化建议。Rosebud提供隐私保护,确保用户数据安全。Rosebud是日记应用,更是心理健康工具,适合希望用低成本改善心理健康的用户。 Rosebud的主要功能 互
FLUX.1 Kontext 是由 Black Forest Labs 推出的图像生成与编辑模型,支持上下文感知的图像处理。模型基于文本和图像提示进行生成与编辑,支持对象修改、风格转换、背景替换、角色一致性保持和文本编辑等多种任务。FLUX.1 Kontext Pro版本支持快速迭代图像编辑,能在多次编辑中保持图像质量和角色特征稳定。。Kontext Max版本在提示词遵循、排版生成和编辑一致性方
ComputerX是基于人工智能的AI Agent工具,通过自然语言指令帮助用户自动化处理各种计算机任务,提升工作效率。能处理多种任务,如旅行规划、数据分析、报告生成、网页应用创建等,支持文本、表格、图像和代码等多种输出格式。ComputerX基于 AI 技术整合来自多个在线来源的信息,提供全面且准确的结果,保持任务执行过程的透明性。 ComputerX的官网地址 官网地址: https:
Voxiyo是AI语音笔记管理应用,帮助用户高效记录、整理和利用语音信息。基于强大的 AI 功能,将语音笔记转化为文字、摘要、关键点和待办事项,实现一键生成和管理。用户可以与语音笔记进行交互式对话,通过语音指令获取笔记的总结、关键信息或任务安排,AI 会自动帮助整理和回忆内容。 Voxiyo的官网地址 官网地址:https://voxiyo.com/ 苹果AppStore应用商店:htt
MedRAG是南洋理工大学研究团队提出的医学诊断模型,通过结合知识图谱推理增强大语言模型(LLM)的诊断能力。模型构建了四层细粒度诊断知识图谱,可精准分类不同病症表现,通过主动补问机制填补患者信息空白。MedRAG在真实临床数据集上诊断准确率提升了11.32%,具备良好的泛化能力,可应用于不同LLM基模型。MedRAG支持多模态输入,能实时解析症状并生成精准诊断建议。 MedRAG的主要功能
文本到图像的扩散模型的最新进展已取得显著成功,但它们往往难以完全捕捉用户的意图。现有的使用文本输入结合边界框或区域蒙版的方法无法提供精确的空间引导,常常导致对象方向错位或意外。为了解决这些限制,我们提出了涂鸦引导扩散(ScribbleDiff),这是一种无需训练的方法,它利用用户提供的简单涂鸦作为视觉提示来引导图像生成。然而,将涂鸦纳入扩散模型存在挑战,因为涂鸦具有稀疏和单薄的特性,很难确保准确的
Mysite.ai 是专为小型企业设计的AI网站构建器。基于简单的AI驱动的方式帮助用户快速创建网站。用户只需回答一些问题,AI 快速生成网站的初始版本,支持用户在此基础上进行调整和修改。工具操作简单,让没有技术背景的用户也能轻松上手。与传统网站构建工具相比,Mysite.ai 更加直观,能快速生成专业外观的网站,节省时间和精力。 Mysite.ai的官网地址 官网地址:https://m
FairyGen 是大湾区大学推出的动画故事视频生成框架,支持从单个手绘角色草图出发,生成具有连贯叙事和一致风格的动画故事视频。框架借助多模态大型语言模型(MLLM)进行故事规划,基于风格传播适配器将角色的视觉风格应用到背景中,用 3D Agent重建角色生成真实的运动序列,基于两阶段运动适配器优化视频动画的连贯性与自然度。FairyGen 在风格一致性、叙事连贯性和运动质量方面表现出色,为个性化
OmniGen2 是北京智源人工智能研究院推出的开源多模态生成模型。能根据文本提示生成高质量图像,支持指令引导的图像编辑,比如修改背景或人物特征等。OmniGen2 采用双组件架构,结合视觉语言模型(VLM)和扩散模型,实现对多种生成任务的统一处理。优势在于开源免费、高性能以及强大的上下文生成能力,适用于商业、创意设计和研究开发等场景。 OmniGen2的项目地址 项目官网:https:/
Speakr是开源免费的AI会议助手,支持确保数据绝对私密的前提下,自动化完成会议录音转写、内容摘要提炼与智能问答。Speakr无需联网就能运行,所有数据处理均在本地完成,彻底杜绝商业机密或敏感对话泄露的风险。用户能轻松上传多种格式的音频文件,后台自动进行转录和摘要生成,不干扰用户操作。Speakr提供交互式聊天功能,用户基于聊天界面与转录内容互动,提问或搜索相关信息,提高用户体验。 Speak
Fireplexity是Firecrawl推出的开源AI问答引擎,基于Next.js构建。Fireplexity支持让开发者快速搭建和托管自己的AI驱动的问答应用。具有快速部署(5分钟内启动)、无供应商锁定(完全开源,可自由定制)、实时智能(基于Firecrawl可靠抓取网页内容,智能筛选并合成带引用的答案)等特点。Fireplexity用GPT-4o-mini生成实时答案,支持替换为任何兼容Op
MAI-DxO(Microsoft AI Diagnostic Orchestrator)是微软推出的先进人工智能系统,能提升医疗诊断的准确性和效率。基于模拟一组具有不同诊断方法的虚拟医生协作解决复杂的医疗案例。MAI-DxO能提出后续问题、订购检查,在获取新信息后更新推理,逐步缩小诊断范围。MAI-DxO能进行成本检查,确保在成本约束内做出诊断。在对《新英格兰医学杂志》发布的复杂病例进行测试时,
蚂蚁PPT是基于人工智能技术的在线AI PPT生成平台,帮助用户快速、高效地创建演示文稿。用户只需输入主题或关键词,系统能自动生成包含大纲、内容和设计的完整PPT初稿。提供多种专业模板,用户可以根据需求调整模板风格、颜色和字体,实现个性化设计。蚂蚁PPT支持多语言输入与生成,适合不同语言背景的用户。适用于教育、商务、个人等多种场景。 蚂蚁PPT的官网地址 官网地址:https://www.
ML-Master是上海交通大学人工智能学院Agents团队推出ML-Master – 上海交大推出的AI专家Agent的AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色,以29.3%的平均奖牌率位居榜首,超越了微软的RD-Agent和OpenAI的AIDE等竞争对手。ML-Master通过“探索-推理深度融合”的创新范式,模拟人类专家的认知策略,整合广泛探索与深度推理,显
ThinkSound是阿里通义语音团队推出的首个CoT(链式思考)音频生成模型,用在视频配音,为每一帧画面生成专属匹配音效。模型引入CoT推理,解决传统技术难以捕捉画面动态细节和空间关系的问题,让AI像专业音效师一样逐步思考,生成音画同步的高保真音频。模型基于三阶思维链驱动音频生成,包括基础音效推理、对象级交互和指令编辑。模型配备AudioCoT数据集,包含带思维链标注的音频数据。在VGGSoun
1. 本研究介绍了 PrefixProt,这是一个新颖的框架,它通过利用预训练蛋白质语言模型 (ProtLM) 上的前缀调整来实现可控蛋白质设计。它使用学习到的虚拟标记作为模块化控制标签,引导蛋白质生成朝着所需的结构和功能特性发展。 2. PrefixProt 最引人注目的特性在于它能够通过组合不同的虚拟标记来生成具有多种用户自定义属性(例如结构和功能)的蛋白质,而无需重新训练基础模型。这种组合
1.VALID-Mol 是一个系统性框架,通过集成快速分子工程、领域特定微调和自动化化学验证,显著提高了 LLM 生成分子的可靠性,有效性从 3% 提高到 83%。 2. 与典型的 LLM 应用程序(这些应用程序会产生看似合理但化学上无效的输出)不同,VALID-Mol 使用化学信息学工具验证每个生成分子的语法和语义,从而确保其科学严谨性。 3. 该框架最引人注目的创新在于其系统化的快速分子工
1. VarDrug 引入了一个机器学习框架,用于预测基因变异如何影响药物反应,重点关注精神类药物。它使用来自 PharmGKB 的数据来解决变异体-药物相互作用问题,并比基于规则的方法取得了显著的性能提升。 2. 其核心是一个自监督变异编码器,该编码器基于 100,000 个人类基因组变异体进行训练,并使用 DNABERT2 嵌入对每个变异体的基因组背景进行编码。将此变异编码器添加到标准机器学
MegaFold是一个跨平台系统,用于加速蛋白质结构预测模型(例如 AlphaFold3、AlphaFold2)。 为什么选择 MegaFold? 跨平台支持:通过优化的基于 Triton 的内核,支持在异构设备上执行,包括 NVIDIA GPU 和 AMD GPU。 易于使用:只需更改几行代码即可获得巨大的性能提升 速度提升:每次迭代训练时间加快高达 1.73 倍 减少内存:将
WebSailor 是阿里通义实验室开源的网络智能体,专注于复杂信息检索与推理任务。通过创新的数据合成方法(如 SailorFog-QA)和训练技术(如拒绝采样微调和 DUPO 算法),在高难度任务中表现出色,在 BrowseComp 等评测中超越多个知名模型,登顶开源网络智能体榜单。WebSailor 的推理重构技术能高效处理复杂任务,生成简洁且精准的推理链。在复杂场景中表现出色,在简单任务中展
飞书Aily是飞书推出的企业级Agent平台,类似于企业版的Manus。飞书Aily能深度调用公司内部知识库、任务系统和项目进度,并运行MCP,是真正意义上的企业级智能助手。平台解决了通用Agent无法进入企业内部的问题,因为企业数据安全至关重要,且企业数据大多存储在飞书的云文档、多维表格等系统中。Aily能接入飞书专属MCP,如飞书云文档、飞书项目、飞书任务等,满足企业个性化需求,提升工作效率。
Agent Zero 是开源的、动态的、可扩展的人工智能框架,成为用户个性化的智能助手。不是预设功能的工具,通过用户的指令和任务动态学习和成长。Agent Zero 具备持久记忆功能,能记住之前的解决方案、代码和事实,以便更快地解决未来任务。将计算机操作系统视为完成任务的工具,可以编写代码并使用终端执行任务,支持多代理协作,能创建下属代理以分解和解决复杂任务。Agent Zero 的行为完全由用户
NativeMind是开源的完全在本地设备运行的AI助手。NativeMind支持DeepSeek、Qwen、Llama等多种模型,基于Ollama集成能无缝加载和切换。NativeMind功能包括智能对话、网页内容分析、翻译、写作辅助等,均在浏览器内完成,无需云同步。NativeMind确保数据100%本地处理,无云依赖,无追踪,无日志,让用户完全掌控自己的数据。 NativeMind的主要功
OmniThink.AI是专注于零售和消费品行业的企业级AI平台,通过预测性和生成性AI技术帮助企业加速产品设计、市场营销和商品规划。基于专有的AI技术快速生成预测结果,以自然语言形式提供可操作的解释;支持全球数据模型,促进零售商和品牌之间的供应链协作,与现有设计工具、POS系统、电子商务和ERP系统无缝集成。 OmniThink.AI的官网地址 官网地址:https://www.omni
只显示前20页数据,更多请搜索
Showing 337 to 360 of 382 results