关键词 "HTTP requests" 的搜索结果, 共 24 条, 只显示前 480 条
OmniHuman-1.5 字节推出的先进的AI模型,能从单张图片和语音轨道生成富有表现力的数字人动画。模型基于双重系统认知理论,融合多模态大语言模型和扩散变换器,模拟人类的深思熟虑和直觉反应。模型能生成动态的多角色动画,支持通过文本提示进行细化,实现更精准的动画效果。OmniHuman-1.5 的动画具有复杂的角色互动和丰富的情感表现,为动画制作和数字内容创作带来全新的可能性,大大提升创作效率和
LoomlyAI 是专注于视觉内容解决方案的 AI 平台,提供 AI 模特和智能换装功能。基于 AI 模型取代传统模特拍摄,快速生成高质量的商业图片和视频,解决模特拍摄成本高、版权复杂和流程繁琐的问题。平台产品亮点包括无 AI 感的多样化模特库、10 秒快速生成的智能换装功能及一键生成视频的功能。LoomlyAI 适用电商、社交媒体和内容创作,帮助用户高效制作视觉内容,提升商业价值。LoomlyA
Quick BI 是阿里云推出的智能商业分析工具,对话式报表搭建、一键智能美化、智能洞察归因等功能,让数据分析更高效。内置 Quick 加速引擎,实现毫秒级查询响应,10 亿数据查询 + 计算仅需 0.3 秒。拖拽式报表搭建,ETL 引擎 0 代码完成数据准备,降低使用门槛适配 PC 端、移动端和大屏端,可集成至办公 IM 应用,覆盖企业数据分析的各种场景。Quick BI 拥有小Q报告 Agen
ReadyBase 是在线 AI 驱动的PDF生成工具,将原始数据或提示快速转换为精美的 PDF 文档。用户只需输入文字、数据或图片等信息,平台会根据内容自动生成排版清晰、逻辑合理的文档,提供多种模板供选择。支持直接接入 AI 模型和研究数据库,丰富文档内容,能以 PDF、高分辨率图片等多种格式导出。可根据反馈或新数据进行调整。适用于多种场景,如销售、市场、高管汇报、客户交付和教育领域等,支持自定
Seed GR-3 是字节跳动 Seed 团队推出的通用机器人模型,具备高泛化能力、长程任务处理能力和柔性物体操作能力。Seed GR-3融合视觉 – 语言 – 动作信息的“大脑”、三合一数据训练法(机器人数据、VR 人类轨迹数据、公开图文数据)及定制的灵活“身体”ByteMini,实现对新物体、新环境和复杂指令的理解与执行。GR-3 在长序列任务、双臂协同操作和柔性物体操作中表现出色,是迈向通用
微软研究院的一个研究团队探索了使用主动式强化学习(agentic reinforcement learning)来实现这一目标,也就是说,模型会与专用工具环境中的工具进行交互,并根据收到的反馈调整其推理方式。而他们的探索成果便是 rStar2-Agent,这是一种强大的主动式强化学习方法。使用该方法,这个微软团队训练了一个 14B 的推理模型 rStar2-Agent-14B—— 该模型达到前沿级
应用在开发过程中,需要不断地进行性能分析与优化,各种监控工具都用上了,却找不到出现问题的地方。 GitHub 上一款专注于性能分析优化的 AI 开源工具:uniprof,帮助开发者精准定位到性能问题。 只需一行命令就能分析任何应用,支持 Python、Node.js、PHP、Java 等语言开发的应用,还能生成可视化的图表帮我们快速定位到问题。 GitHub:http://github.com/i
MedResearcher-R1是蚂蚁集团开源的一款Agentic AI,旨在解决医疗领域的“稀疏知识”难题。它摒弃“数据投喂”模式,转而主动“设计”高质量训练:• 智能数据:通过KISA框架,从3000万+文献中筛选罕见实体,生成高难度多步推理任务。• 精准学习:配备优先考虑“权威性”的专用工具,并采用“蒙版引导”及复合奖励函数,训练AI掌握可泛化的“思考方法”。• 卓越表现:仅用约2100条“
字节跳动开源的图像生成大模型,目前是第4版Seedream 4, 这是字节跳动最新发布的豆包图像创作模型。该模型集成了文生图、图像编辑、多图融合、组图生成等多种能力,最高支持4K分辨率图像生成主要亮点多模态玩法拓展:灵活支持文本、图像的组合输入,允许文生图、图生图、图像编辑、多图编辑、组图生成等创作模式,玩法创意多样。风格化美感提升:支持高度自由的艺术风格迁移,从巴洛克到赛博朋克风,风格百变,更可
一款本地运行 AI 模型的开源工具:Shimmy,全面超越 Ollama。 仅仅 5MB 大小单文件,便提供快速、可靠的本地 AI 推理,同时提供完整的 OpenAI 兼容 API。 基于 Rust 构建,性能优化达到了极致,启动时间不到 100ms、内存占用仅 50MB。 GitHub: https://github.com/Michael-A-Kuykendall/shimmy 并且无需配
项目主页:https://unigen-x.github.io/unifolm-world-model-action.github.io/开源代码网址:https://github.com/unitreerobotics/unifolm-world-model-action
阿里巴巴推出FunAudio-ASR语音识别大模型,专为解决企业落地难题。模型通过创新的Context增强模块,有效优化了“幻觉”“串语种”等关键问题。在高噪声等复杂场景下,其识别准确率显著提升,幻觉率从78.5%降至10.7%。目前,FunAudio-ASR 已在钉钉的“AI听记”、视频会议、DingTalk A1硬件等多个场景中应用,验证了其在真实企业环境中的稳定性和高精度识别能力,特别是在垂
通义DeepResearch 是阿里巴巴推出的开源深度研究智能体,专为长周期、深度信息检索任务设计。拥有 300 亿参数,每次激活 30 亿参数,支持 ReAct 模式和深度模式(Heavy Mode),后者通过迭代研究范式(IterResearch)提升复杂推理能力。智能体采用全流程合成数据方案,无需人工干预即可生成高质量数据集,突破智能体能力上限。训练流程涵盖智能体持续预训练(Agentic
RustGPT 是用 Rust 编写的 Transformer 架构语言模型。RustGPT从零开始构建,不依赖任何外部机器学习框架,仅用 ndarray 进行矩阵运算。项目包括事实文本补全的预训练、用于会话 AI 的指令微调及交互式聊天模式测试。RustGPT模块化架构确保关注点的清晰分离,便于理解和扩展。RustGPT 适合对 Rust 和机器学习感兴趣的开发者,是一个优秀的学习项目。Rust
Orchids 是全球首款具备全栈开发能力的 AI 工具,能实现从前端到后端的全流程开发。工具在 UI 设计和全栈开发性能上表现卓越,超越多个主流竞品,如 Lovable、Bolt、v0 等。用户无需依赖外部服务,能构建原型、设计 UI 模型,生成完整应用程序与网站。Orchids 的出现,有望推动开发者更专注于创意实现,减少重复性编码工作,为全栈开发领域带来新的变革。Orchids的主要功能全栈
Evoker 是一站式 AI 创作平台,激发创意灵感并加速创作过程。支持文本、图像和视频生成,提供多模态创作体验。用户可以在一个聊天框中轻松创作和完善作品,平台提供灵感市场,帮助用户发现新想法和创意触发点。Evoker 集成了多种先进的 AI 模型和工具,支持多模型共享上下文,使创作过程更加连贯。提供 Figma 插件,让用户在熟悉的工作环境中完成设计咨询或创作。Evoker的主要功能多模态创作:
YuLan-OneSim(玉兰-万象)是中国人民大学高瓴 AI 学院RUC-GSAI团队推出的新型社会模拟器。基于大型语言模型(LLM)Agents 模拟人类社会行为,无需编程构建模拟场景,基于自然语言交互生成代码。YuLan-OneSim提供50多个涵盖8个主要社会科学领域的默认场景,支持高达10万Agents的大规模模拟,基于外部反馈自动优化LLM。YuLan-OneSim具备AI社会研究者功
SimpleFold 是苹果公司推出的轻量级蛋白质折叠预测 AI 模型。模型基于流匹配(Flow Matching)技术,跳过多序列比对(MSA)等复杂模块,直接从随机噪声生成蛋白质的三维结构,大幅降低计算成本。在 CAMEO22 和 CASP14 等权威基准测试中,SimpleFold 表现出色,无需昂贵的多序列比对和三角注意机制,能达到与顶尖模型(如 AlphaFold2、RoseTTAFol
AI Quests 是谷歌研究团队与斯坦福学习加速器联合推出的游戏化教育工具,通过沉浸式冒险活动,让11至14岁的学生学习人工智能(AI)及在现实世界中的应用。学生将扮演谷歌研究人员的角色,解决与气候、健康和科学相关的问题。首个任务是洪水预测,未来将有糖尿病视网膜病变检测和大脑映射等任务。每个任务配有课程计划、教师指南和真实研究人员的视频信息,帮助学生理解AI的实际应用。AI Quests主要功能
Neovate Code 是蚂蚁集团开源的智能编程助手,专注于提升开发效率。工具能深度理解代码库,遵循既有编码习惯,精准完成代码生成、Bug修复和重构等任务。通过对话式界面,支持开发者用自然地描述需求,Neovate Code 提供安全、可控的实现方案。工具支持多种流行模型(如 OpenAI、Anthropic 等),可通过插件系统灵活扩展功能。目前以 CLI 工具形式提供,未来将适配更多客户端形
Mixboard 是谷歌实验室推出的全新 AI 画板工具,由 Nano Banana 提供支持。工具通过自然语言交互,让用户能轻松将任何想法即时可视化。用户输入文本提示或选择预置模板,AI 能生成一系列相关图片。Mixboard 支持批量编辑、组合图片、风格迁移,能对图片进行客观描述、调整文字格式。Mixboard 适用创意设计、家居装饰、派对策划等多种场景,帮助用户快速探索和优化创意。Mixbo
Castwise 是为播客创作者设计的AI内容转化工具。工具能将播客音频快速转化为多种格式的内容,如节目笔记、公众号文章、小红书笔记、社交媒体帖子、字幕、思维导图等,极大地提高内容分发的效率。用户只需上传音频文件或提供链接,系统能高效处理、生成多种素材,支持多语言。Castwise 的目标是将播客转化为强大的营销引擎,帮助创作者实现“一次录制,多平台发布”,提升内容的传播范围和影响力。Castwi
PodClips 是一款专为播客创作者设计的工具,可将长篇播客内容迅速转化为适合社交媒体分享的短视频。其核心功能包括:智能剪辑:只需一键,PodClips 就能将您的播客音频或视频内容自动剪辑成短视频,例如 Shorts 或 Clips,省去繁琐的手动编辑。高效自动化:自动为视频添加精确字幕和元数据(如标题和描述),确保内容能在各大平台获得最佳展示效果。品牌强化:您可以轻松地为视频添加 logo
Fish Speech 是一款由 Fish Audio 开源的文本转语音(TTS)工具,支持中、英、日三国语言。它经过 15 万小时的多语种数据训练,能生成接近人类水平的自然语音。其最新版本为 1.2,拥有以下核心优势:核心功能与技术亮点高效且低门槛:只需 4GB 显存即可运行,极大地降低了硬件要求。此外,快速的推理速度能让您在短时间内获得所需的语音输出,提升了整体使用体验。支持多种模型:集成了包
只显示前20页数据,更多请搜索
Showing 433 to 456 of 486 results