关键词 "http" 的搜索结果, 共 24 条, 只显示前 480 条
一款本地运行 AI 模型的开源工具:Shimmy,全面超越 Ollama。 仅仅 5MB 大小单文件,便提供快速、可靠的本地 AI 推理,同时提供完整的 OpenAI 兼容 API。 基于 Rust 构建,性能优化达到了极致,启动时间不到 100ms、内存占用仅 50MB。 GitHub: https://github.com/Michael-A-Kuykendall/shimmy 并且无需配
项目主页:https://unigen-x.github.io/unifolm-world-model-action.github.io/开源代码网址:https://github.com/unitreerobotics/unifolm-world-model-action
阿里巴巴推出FunAudio-ASR语音识别大模型,专为解决企业落地难题。模型通过创新的Context增强模块,有效优化了“幻觉”“串语种”等关键问题。在高噪声等复杂场景下,其识别准确率显著提升,幻觉率从78.5%降至10.7%。目前,FunAudio-ASR 已在钉钉的“AI听记”、视频会议、DingTalk A1硬件等多个场景中应用,验证了其在真实企业环境中的稳定性和高精度识别能力,特别是在垂
通义DeepResearch 是阿里巴巴推出的开源深度研究智能体,专为长周期、深度信息检索任务设计。拥有 300 亿参数,每次激活 30 亿参数,支持 ReAct 模式和深度模式(Heavy Mode),后者通过迭代研究范式(IterResearch)提升复杂推理能力。智能体采用全流程合成数据方案,无需人工干预即可生成高质量数据集,突破智能体能力上限。训练流程涵盖智能体持续预训练(Agentic
RustGPT 是用 Rust 编写的 Transformer 架构语言模型。RustGPT从零开始构建,不依赖任何外部机器学习框架,仅用 ndarray 进行矩阵运算。项目包括事实文本补全的预训练、用于会话 AI 的指令微调及交互式聊天模式测试。RustGPT模块化架构确保关注点的清晰分离,便于理解和扩展。RustGPT 适合对 Rust 和机器学习感兴趣的开发者,是一个优秀的学习项目。Rust
Orchids 是全球首款具备全栈开发能力的 AI 工具,能实现从前端到后端的全流程开发。工具在 UI 设计和全栈开发性能上表现卓越,超越多个主流竞品,如 Lovable、Bolt、v0 等。用户无需依赖外部服务,能构建原型、设计 UI 模型,生成完整应用程序与网站。Orchids 的出现,有望推动开发者更专注于创意实现,减少重复性编码工作,为全栈开发领域带来新的变革。Orchids的主要功能全栈
Evoker 是一站式 AI 创作平台,激发创意灵感并加速创作过程。支持文本、图像和视频生成,提供多模态创作体验。用户可以在一个聊天框中轻松创作和完善作品,平台提供灵感市场,帮助用户发现新想法和创意触发点。Evoker 集成了多种先进的 AI 模型和工具,支持多模型共享上下文,使创作过程更加连贯。提供 Figma 插件,让用户在熟悉的工作环境中完成设计咨询或创作。Evoker的主要功能多模态创作:
YuLan-OneSim(玉兰-万象)是中国人民大学高瓴 AI 学院RUC-GSAI团队推出的新型社会模拟器。基于大型语言模型(LLM)Agents 模拟人类社会行为,无需编程构建模拟场景,基于自然语言交互生成代码。YuLan-OneSim提供50多个涵盖8个主要社会科学领域的默认场景,支持高达10万Agents的大规模模拟,基于外部反馈自动优化LLM。YuLan-OneSim具备AI社会研究者功
SimpleFold 是苹果公司推出的轻量级蛋白质折叠预测 AI 模型。模型基于流匹配(Flow Matching)技术,跳过多序列比对(MSA)等复杂模块,直接从随机噪声生成蛋白质的三维结构,大幅降低计算成本。在 CAMEO22 和 CASP14 等权威基准测试中,SimpleFold 表现出色,无需昂贵的多序列比对和三角注意机制,能达到与顶尖模型(如 AlphaFold2、RoseTTAFol
AI Quests 是谷歌研究团队与斯坦福学习加速器联合推出的游戏化教育工具,通过沉浸式冒险活动,让11至14岁的学生学习人工智能(AI)及在现实世界中的应用。学生将扮演谷歌研究人员的角色,解决与气候、健康和科学相关的问题。首个任务是洪水预测,未来将有糖尿病视网膜病变检测和大脑映射等任务。每个任务配有课程计划、教师指南和真实研究人员的视频信息,帮助学生理解AI的实际应用。AI Quests主要功能
Neovate Code 是蚂蚁集团开源的智能编程助手,专注于提升开发效率。工具能深度理解代码库,遵循既有编码习惯,精准完成代码生成、Bug修复和重构等任务。通过对话式界面,支持开发者用自然地描述需求,Neovate Code 提供安全、可控的实现方案。工具支持多种流行模型(如 OpenAI、Anthropic 等),可通过插件系统灵活扩展功能。目前以 CLI 工具形式提供,未来将适配更多客户端形
Mixboard 是谷歌实验室推出的全新 AI 画板工具,由 Nano Banana 提供支持。工具通过自然语言交互,让用户能轻松将任何想法即时可视化。用户输入文本提示或选择预置模板,AI 能生成一系列相关图片。Mixboard 支持批量编辑、组合图片、风格迁移,能对图片进行客观描述、调整文字格式。Mixboard 适用创意设计、家居装饰、派对策划等多种场景,帮助用户快速探索和优化创意。Mixbo
Castwise 是为播客创作者设计的AI内容转化工具。工具能将播客音频快速转化为多种格式的内容,如节目笔记、公众号文章、小红书笔记、社交媒体帖子、字幕、思维导图等,极大地提高内容分发的效率。用户只需上传音频文件或提供链接,系统能高效处理、生成多种素材,支持多语言。Castwise 的目标是将播客转化为强大的营销引擎,帮助创作者实现“一次录制,多平台发布”,提升内容的传播范围和影响力。Castwi
PodClips 是一款专为播客创作者设计的工具,可将长篇播客内容迅速转化为适合社交媒体分享的短视频。其核心功能包括:智能剪辑:只需一键,PodClips 就能将您的播客音频或视频内容自动剪辑成短视频,例如 Shorts 或 Clips,省去繁琐的手动编辑。高效自动化:自动为视频添加精确字幕和元数据(如标题和描述),确保内容能在各大平台获得最佳展示效果。品牌强化:您可以轻松地为视频添加 logo
Fish Speech 是一款由 Fish Audio 开源的文本转语音(TTS)工具,支持中、英、日三国语言。它经过 15 万小时的多语种数据训练,能生成接近人类水平的自然语音。其最新版本为 1.2,拥有以下核心优势:核心功能与技术亮点高效且低门槛:只需 4GB 显存即可运行,极大地降低了硬件要求。此外,快速的推理速度能让您在短时间内获得所需的语音输出,提升了整体使用体验。支持多种模型:集成了包
Spark Chemistry-X1-13B 是科大讯飞开源的化学专业大型语言模型。模型基于讯飞星火X1-0420大模型,经过多种化学任务数据集的微调,具备卓越的复杂化学问题解决能力,同时保持强大的通用性。模型基于新的注意力掩码机制,结合长思维链和快思考,有效防止不同推理模式之间的干扰。模型在高等知识问答、化学名称转换和分子性质预测等任务上表现出色,能助力化学科研工作的高效推进,激发跨领域创新,推
CWM(Code World Model)是 Meta 开源的一个拥有 320 亿参数的代码语言模型。它率先将“世界模型”的概念引入代码生成领域,让模型能够通过模拟代码执行过程,更深层次地理解和生成代码,而不仅仅是基于模式匹配。CWM 在多项基准测试中表现出色,例如在 Math-500 数据集上取得了 96.6% 的准确率。该模型的权重已公开,旨在推动代码生成和理解领域的研究,并帮助开发者更高效地
MiroMind:由陈天桥先生创立的预测型 AI 平台MiroMind 是由陈天桥推出的一个专注于 AI 领域的平台,致力于开发全球领先的预测型大模型。该平台的核心理念是让 AI “记住过去、洞察未来”,通过其独特的记忆驱动机制,帮助 AI 进行更精准的预测与决策。MiroMind 的主要产品包括:MiroThinker:一个开源的深度研究模型,在 GAIA 等基准测试中表现出色,超越了许多同类开
Qianfan-VL 是百度智能云千帆专为企业级多模态应用场景打造的视觉理解大模型。它提供 3B、8B 和 70B 三种尺寸,不仅具备出色的通用能力,还针对 OCR、教育等垂直领域进行了专项强化。该模型基于开源模型,并在百度自研的昆仑芯 P800 上完成了全流程计算任务,展现出卓越的性能和效率。核心功能多尺寸模型:提供从轻量级到大规模的三种版本,满足不同企业和开发者的需求,适用于各种场景,从端上实
Lessie AI 号称是全球首个**“人物搜索”AI 智能体**(People Search AI Agent),致力于帮助您高效连接任何人、链接世界。这款专注于网红营销的 AI 工具目前处于免费测试阶段,每月提供 1500 次免费网红搜索额度。Lessie AI 能在短短 30 秒内,为您在 TikTok、YouTube 和 Instagram 等主流社交媒体平台上,找到 500+ 位与您的品
Loomi 是一款专为创作者设计的 AI 工具,旨在通过其独特的多智能体协作模式,覆盖内容生产的全流程。从话题洞察、受众画像到创作策略,Loomi 能够全方位地为创作者提供支持,让内容创作更高效、更具深度。该工具的核心优势在于其自研的 Nexus 情境引擎,它能构建稳固的思维网络,支持长文创作和复杂并行思考,确保创作任务清晰、步骤精准,让您不再迷失方向。Loomi 的开发团队融入了 100 多位内
LatticeWorld 是一个开创性的多模态 3D 世界生成框架,由网易、香港城市大学、北京航空航天大学、清华大学等机构共同推出。它将大语言模型与工业级 3D 渲染引擎 Unreal Engine 5(UE5)相结合,能通过简单的文本描述和视觉指令,快速生成具备高动态环境、真实物理仿真和实时渲染的大规模交互式 3D 世界。与传统手工创作相比,LatticeWorld 的效率提升超过 90 倍,且
Shipable 是一款专为用户设计的无代码人工智能代理平台,旨在帮助您快速、高效地构建、定制和部署智能 AI 代理,实现复杂任务的自动化。通过其可视化构建器,用户无需任何编程知识,即可轻松创建多语言自动化工作流,并结合系统提示和应用程序集成,让您的 AI 代理不仅能智能回复,更能执行实际操作,如预订、更新等,从而显著提升工作效率。核心功能无代码构建:通过直观的可视化构建器,您可以轻松创建复杂的多
Rocket.new 是一款革命性的 AI 编程平台,专注于帮助用户快速构建和部署全功能的 Web 和移动应用。您只需用简单的提示描述您的需求,Rocket.new 就能自动生成完整的应用,包括后端集成、数据库架构、API 端点和高质量代码。该平台的核心优势在于其深度集成和高效自动化能力,它能进行市场研究、优化用户体验,并提供高质量模板,帮助您快速启动项目。Rocket.new 的用户群体遍布美国
只显示前20页数据,更多请搜索
Showing 385 to 408 of 429 results