关键词 "HTTP requests" 的搜索结果, 共 24 条, 只显示前 480 条
dots.ocr 是小红书 hi lab 开源的多语言文档布局解析模型。模型基于 17 亿参数的视觉语言模型(VLM),能统一进行布局检测和内容识别,保持良好的阅读顺序。模型规模虽小,但性能达到业界领先水平(SOTA),在 OmniDocBench 等基准测试中表现优异,公式识别效果能与Doubao-1.5和 gemini2.5-pro 等更大规模模型相媲美,在小语种解析方面优势显著。dots.o
DispatchMail 是开源的、本地运行的 AI 邮件助手,支持通过AI技术自动化收件箱管理。工具能实时监控邮件,用 OpenAI 的 AI Agent根据用户自定义的提示词对邮件进行智能处理和分析。工具提供本地运行的 Web 界面,支持邮件筛选、草稿生成、自动归档和深度发件人研究等功能。所有数据存储在本地 SQLite 数据库中,确保用户隐私和数据安全。 项目地址 GitHub仓库:
Mocha 是 AI 驱动的无代码应用构建平台,帮助创业者和非技术用户快速将应用想法转化为实际产品。用户只需通过自然语言描述应用需求,Mocha 的 AI 引擎即可生成完整的应用框架,无需编写代码。平台支持实时预览和迭代,用户可以随时调整设计、添加功能或上传图片,在满意后一键发布应用。 官网地址 官网地址:https://getmocha.com/
iFlow CLI 是阿里旗下心流团队推出的能运行在终端的 AI 智能体,专为开发者和高效工作者设计。iFlow CLI支持自然语言交互,能快速分析代码、生成文档、调试程序、管理文件、查询信息等。iFlow CLI 内置强大的 AI 模型(如 Qwen3-Coder、Kimi K2 等),支持用户在终端中高效完成复杂任务,提升工作效率。iFlow CLI 安装便捷,支持多种操作系统,完全免费,是编
Launch 是基于人工智能帮助用户快速构建全栈应用的工具。用户无需具备深入的编程知识或开发团队,只需通过简单的文字提示,能生成包含前端、后端、数据库、用户认证和支付功能的完整应用。平台主打快速、高效,适合创业者、初创公司或个人开发者快速验证产品创意并上线。提供直观的界面和无代码开发体验,让用户专注于产品逻辑而非技术细节,降低开发门槛。 Launch的主要功能 AI 驱动的应用生成:用
Jenova 是先进的人工智能平台,帮助用户高效地从研究到生成报告。通过集成多种强大的 AI 模型,如 GPT-4o、Claude 和 Gemini,提供更精准的搜索结果和更智能的交互体验。与传统的搜索引擎相比,Jenova 能理解复杂的查询意图,能实时联网获取最新信息,确保用户获取到的信息是最新的。Jenova 的功能丰富多样,支持文档处理、图像识别、语音转文字等多种功能。用户可以上传各种格式的
AI-Researcher 是香港大学数据科学实验室推出的开源自动化科学研究工具,基于大型语言模型(LLM)代理实现从研究想法到论文发表的全流程自动化。AI-Researcher 支持用户在两种模式下操作:一是提供详细的研究想法描述,系统据此生成实现策略;二是提供参考文献,系统自主生成创新想法实施。平台集成文献综述、想法生成、算法设计与验证、结果分析和论文撰写等核心功能,支持多领域研究,基于开源的
ImageBind是Meta公司推出的开源多模态AI模型,将文本、音频、视觉、温度和运动数据等六种不同类型的信息整合到一个统一的嵌入空间中。模型通过图像模态作为桥梁,实现其他模态数据的隐式对齐,无需直接的模态间配对数据。ImageBind在跨模态检索、零样本分类等任务中展现出色的性能,为创建沉浸式、多感官的AI体验提供新的可能性。 ImageBind的项目地址 项目官网:imagebind
Gradio 是一个开源的 Python 库,简化机器学习模型的演示和共享过程。支持开发者基于简单的代码快速创建出友好的网页界面,任何人、任何地点能轻松使用机器学习模型。Gradio 支持多种输入和输出组件,如文本、图像、音频等,适用于演示、教学和原型开发。Gradio 支持服务器端渲染(SSR),使应用更快地在浏览器中加载。Gradio提供与 Hugging Face Spaces 更紧密的集成
SelectYet是实用的AI文献分析工具,基于先进的AI技术和“记忆摘要”技术,为研究人员提供高效便捷的文献处理服务。用户只需输入研究主题、上传PDF文献,设置自定义分析选项,可快速启动分析。工具能对海量文献进行结构化分析,快速提取关键信息,形成文献综述,加速信息筛选和整理的过程。SelectYet接入了deepseek-R1/V3模型,未来将融合更多模型的优势,提升分析的准确性和效率。 Se
Higress MCP 是今日投资推出的MCP市场,支持将今日投资丰富的金融数据存量 API 快速转化为 MCP(Model Calling Protocol)服务。平台基于简单的配置,无需编写代码,将 REST API 转换为 MCP Server,极大地简化开发流程。平台具备强大的企业级能力,包括统一认证授权、精细化流量控制、全链路可观测性等,能满足企业在安全、稳定性和性能方面的需求。平台提供
Macaron 是首个 Personal AI Agent,你的贴心AI伙伴。Macaron 能根据简单请求快速生成实用的生活工具,如健身追踪器、旅行规划器、阅读管理器等,帮助用户更好地生活。Macaron基于深度记忆系统,记住用户偏好、习惯和情绪,无需重复上下文就能理解需求。Macaron不仅关注效率,更注重情感连接,用温暖和同理心陪伴。Macaron 的目标是让生活更有意义,不是单纯追求生产力
LandPPT 是AI演示文稿生成平台,能将文档内容快速转换为专业的 PPT 演示文稿。LandPPT支持 OpenAI、Claude、Gemini 等多种 AI 模型,兼容 PDF、Word、Markdown 等文件格式,支持智能解析内容,生成结构清晰的大纲和精美的 PPT 页面。平台提供丰富的模板系统和自定义功能,用户基于现代化的 Web 界面进行可视化编辑、实时预览和多格式导出。LandPP
NeuralAgent 是开源的桌面 AI 个人助手,通过自然语言指令自动化执行多种复杂任务,如模拟键盘输入、鼠标点击、浏览器导航、表单填写和邮件发送等。NeuralAgent 支持桌面自动化,在 Windows 平台上支持后台浏览器控制,实现高效任务处理。NeuralAgent 集成 Claude、GPT-4、Azure OpenAI、Bedrock、Ollama 和 Gemini 等多种主流语
WrenAI 是 Canner 推出的开源商业智能 AI Agent工具。通过自然语言交互,帮助用户快速查询、分析和可视化结构化数据,无需编写复杂的 SQL 代码。用户只需用普通语言提出问题,WrenAI 能生成精准的 SQL 查询语句,以图表、报告等多种形式输出结果。通过架构嵌入和相关性检索,确保查询的准确性和上下文对齐。支持多种主流数据库(如 PostgreSQL、MySQL、Snowflak
Glass 是Pickle 团队推出的开源隐形 AI 桌面助手。Glass能在后台实时捕捉屏幕内容和音频,将其转化为结构化知识。Glass核心功能包括实时会议记录、自动摘要生成、上下文理解及实时问答。Glass 的设计真正隐形,不会出现在屏幕录制、截图或 Dock 中,完全不干扰用户操作。Glass支持 macOS 和 Windows 系统,用户能免费使用,且无需注册。Glass开源特性成为 AI
DreamVVT 是字节跳动和清华大学(深圳)联合推出的视频虚拟试穿(Video Virtual Try-On, VVT)技术,基于扩散 Transformer(DiTs)框架,通过两阶段方法实现高保真且时间连贯的虚拟试穿效果。第一阶段从输入视频中采样关键帧,结合视觉语言模型(VLM)生成语义一致的试穿图像;第二阶段利用骨骼图和运动信息,结合预训练视频生成模型,确保视频的动态连贯性。DreamVV
Machined AI 是 AI 内容创作平台,专为高效生成高质量内容而设计,平台能在短时间内完成内容创作任务,包括撰写文章、构建内容集群、自动化关键词研究、内部链接和发布等。平台核心优势在于快速生成事实准确、引用权威的内容,支持与 WordPress、Webflow 等平台的无缝集成,提供个性化功能,如自带 API 密钥,帮助用户降低成本。Machined AI 是内容创作者和团队提升效率、建立
魂旅是创新的AI虚拟旅行体验应用。用户可以通过设定旅行目的地和交通工具(如自行车、摩托车、房车等),应用会生成一个“分身”代替用户开启旅程。在旅行过程中,AI会根据目的地的天气、景点等信息生成生动的故事,通过语音播报的方式让用户仿佛身临其境。应用会根据环境特征动态模拟风声、雨声、海浪声等音效,增强沉浸感。用户可以在地图上实时查看载具的移动轨迹,能通过“行车记录仪”回顾旅行过程。魂旅提供电台广播功能
Qwen-Image-Edit基于我们20B的Qwen-Image模型进⼀步训练,成功将Qwen-Image的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。此外,Qwen-Image-Edit将输⼊图像同时输⼊到Qwen2.5-VL(实现视觉语义控制)和VAE Encoder(实现视觉外观控制),从而兼具语义与外观的双重编辑能⼒。如需体验最新模型,欢迎访问 Qwen Chat
MemU 是面向AI情感陪伴开源的AI记忆框架。MemU 能记住用户与 AI 的每一次对话,提取重点并建立知识图谱,让 AI 真正理解用户。MemU 的记忆会自主进化,随着使用不断优化。MemU 支持快速集成,只需几行代码能让 AI 拥有持久记忆。相比其他框架,MemU 准确率高达92%,成本降低90%,检索速度快至50毫秒。在情感陪伴、教育等其他场景,MemU 都能成为用户贴心的智能伙伴。 M
Filo 是AI智能邮箱管理应用。基于内置的 AI 助手,理解执行用户的简单指令,如自动清理垃圾邮件、分类整理邮件、安排任务等,极大地简化邮件管理流程。Filo目前主要支持 Gmail,提供 iOS 版本。Filo Mail不存储用户数据,确保隐私安全。支持用户基于 Discord 社区反馈建议或获取支持。Filo能帮助用户减少在邮件管理上花费的时间,更多时间专注于重要事务。 Filo的主要功能
Ludo.ai 是强大的AI游戏开发平台,能帮助开发者从创意构思到实际开发的全过程。平台提供丰富的功能,包括游戏概念生成、AI 驱动的 3D 资产和图像生成、自定义精灵动画、视频生成、可玩原型制作、市场趋势分析、代码生成等。基于这些工具,开发者能快速生成创意、优化设计、验证想法,加速开发流程。 Ludo.ai的官网地址 官网地址:https://ludo.ai/
只显示前20页数据,更多请搜索
Showing 385 to 408 of 486 results