关键词 "文本生成交互式 3D 场景" 的搜索结果, 共 24 条, 只显示前 480 条
Comate 是百度推出的一款智能编码助手,它利基于「文心大模型」,结合百度积累多年的编程现场大数据和外部优秀开源数据,打造的新一代编码辅助工具。拥有代码智能、场景丰富、创造价值、广泛应用等多重产品优势,可实现“帮你想、帮你写、帮你改”的场景应用形态。提升编码效率,释放“十倍”软件生产力。 核心功能 1.代码生成 如前所述,Comate 能够在我们暂停编码时,根据我们的代码上下文,智能补全代
Miniwork是高效的AI工具平台,聚焦提升工作、学习、内容创作、运营营销等多个方向,专为提升工作与学习效率的用户打造。Miniwork涵盖SEO分析及优化、写作辅助、图像生成、PDF处理、营销策划及运营管理等多元化AI工具,通过前沿技术集成包括GPT-4o、Claude 3.7 sonnet、Gemini 1.5 Flash、Llama 3.1、DeepSeek-R1、GLM-4-plus等在
HermitAI是专为外贸和跨境人员设计的智能内容营销创作工具。工具支持智能生成多种场景下的外贸营销文案,涵盖邮件创作、社交媒体营销、店铺运营和短视频创作等核心工作场景。HermitAI提供实用辅助工具,如精准翻译、图生文和文案润色等功能,帮助用户解决语言障碍和提升文案质量。基于50+种细化场景的文案生成,HermitAI大大提高外贸人员的工作效率,是外贸和跨境人员的得力助手。
智声云配(DubbingX) 是 AI 智能配音工具,提供语音合成(TTS)、音色迁移、歌声转换等多种功能。工具支持中文、英文、日文、粤语等多语言,拥有近2500种情绪语态,支持高度定制,满足游戏、影视、动漫、有声书等多场景需求。工具音色版权合规,支持商用,能显著降低配音成本。智声云配结合专业高校和全球配音演员资源,致力于为用户提供高质量、多样化的音频解决方案。 智声云配官网:https://d
4D-LRM(Large Space-Time Reconstruction Model)是Adobe研究公司、密歇根大学等机构的研究人员共同推出的新型4D重建模型。模型能基于稀疏的输入视图和任意时间点,快速、高质量地重建出任意新视图和时间组合的动态场景。模型基于Transformer的架构,预测每个像素的4D高斯原语,实现空间和时间的统一表示,具有高效性和强大的泛化能力。4D-LRM在多种相机设
Qwen VLo 是通义千问团队推出的多模态统一理解与生成模型。在多模态大模型的基础上进行了全面升级,能“看懂”世界,能基于理解进行高质量的再创造,实现了从感知到生成的跨越。能精准理解图像内容,在此基础上进行一致性和高质量的生成。用户可以通过自然语言指令要求模型对图像进行风格转换、场景重构或细节修饰,模型能灵活响应并生成符合预期的结果。Qwen VLo 支持多语言指令,打破语言壁垒,为全球用户提供
FairyGen 是大湾区大学推出的动画故事视频生成框架,支持从单个手绘角色草图出发,生成具有连贯叙事和一致风格的动画故事视频。框架借助多模态大型语言模型(MLLM)进行故事规划,基于风格传播适配器将角色的视觉风格应用到背景中,用 3D Agent重建角色生成真实的运动序列,基于两阶段运动适配器优化视频动画的连贯性与自然度。FairyGen 在风格一致性、叙事连贯性和运动质量方面表现出色,为个性化
OmniGen2 是北京智源人工智能研究院推出的开源多模态生成模型。能根据文本提示生成高质量图像,支持指令引导的图像编辑,比如修改背景或人物特征等。OmniGen2 采用双组件架构,结合视觉语言模型(VLM)和扩散模型,实现对多种生成任务的统一处理。优势在于开源免费、高性能以及强大的上下文生成能力,适用于商业、创意设计和研究开发等场景。 OmniGen2的项目地址 项目官网:https:/
圆周旅迹是专注于旅行规划的智能应用,帮助用户高效、便捷地安排旅行行程。通过简洁直观的界面设计和强大的AI功能,让用户能快速输入目的地、时间等信息,自动生成合理且个性化的行程安排。支持从社交平台一键导入链接、文字或图片,快速生成同款行程;提供3D全景地图导航和路径拖拽功能,帮助用户直观规划路线;方便旅行伙伴共同编辑行程并实时更新。圆周旅迹整合了实时交通数据,支持离线地图缓存,确保用户在无网络环境下也
蚂蚁PPT是基于人工智能技术的在线AI PPT生成平台,帮助用户快速、高效地创建演示文稿。用户只需输入主题或关键词,系统能自动生成包含大纲、内容和设计的完整PPT初稿。提供多种专业模板,用户可以根据需求调整模板风格、颜色和字体,实现个性化设计。蚂蚁PPT支持多语言输入与生成,适合不同语言背景的用户。适用于教育、商务、个人等多种场景。 蚂蚁PPT的官网地址 官网地址:https://www.
1. 本研究介绍了 PrefixProt,这是一个新颖的框架,它通过利用预训练蛋白质语言模型 (ProtLM) 上的前缀调整来实现可控蛋白质设计。它使用学习到的虚拟标记作为模块化控制标签,引导蛋白质生成朝着所需的结构和功能特性发展。 2. PrefixProt 最引人注目的特性在于它能够通过组合不同的虚拟标记来生成具有多种用户自定义属性(例如结构和功能)的蛋白质,而无需重新训练基础模型。这种组合
WebSailor 是阿里通义实验室开源的网络智能体,专注于复杂信息检索与推理任务。通过创新的数据合成方法(如 SailorFog-QA)和训练技术(如拒绝采样微调和 DUPO 算法),在高难度任务中表现出色,在 BrowseComp 等评测中超越多个知名模型,登顶开源网络智能体榜单。WebSailor 的推理重构技术能高效处理复杂任务,生成简洁且精准的推理链。在复杂场景中表现出色,在简单任务中展
Pokee AI 是下一代通用 AI Agent 开发平台。平台基于强化学习(RL)技术构建高效、个性化且交互性强的 AI Agent,替代传统大语言模型进行任务规划和工具调用。Pokee AI 的 Agent 在多步骤任务执行、推理和工具使用方面表现出色,能快速响应用户指令、提供精准服务,适用于电商、开发与创作、企业自动化等多个领域,基于个性化服务与用户建立长期绑定关系,推动 AI 在更多场景中
zoomoutai.pro 与众不同,因为它不仅仅是把图片放大。它会智能地猜测并补充缺失的部分,让图片看起来更清晰、更真实,而不是模糊或拉伸变形。它在浏览器里就能使用,不需要安装任何软件。很多工具只会把图片放大,但这个工具还能修复细节,让图片更好看。 Zoom Out AI 是一款免费工具,可将任何图像转换为缩小视频,直至看到地球。非常适合演示、创意项目和娱乐!无需下载或注册。
观猹是特工宇宙团队打造的下一代内容社交平台,自称是“AI 应用的大众点评”。涵盖热门 Agent,观猹按“通用助手、效率工具、虚拟陪伴”等板块卡片式陈列,用户可一键试玩、打分、写评价,内容会像小红书笔记一样流转。通过观猹,创意得以被看见、被验证,产品得以不断完善,用户也能成为产品进化的重要推动者。 观猹的主要功能 观猹首页:首页主要分为“今日热门”和“猹猹新品”两个板块,帮助用户速览最新A
万象驭影是北京矩阵像素科技推出的基于多模态智能体工程的智能视频创作工具,以技术创新重构视频内容生产流程,解决行业高门槛、低效率的创作痛点。独创代理式跨模态处理系统,通过多智能体协同拆解视频物料,实现从外层标题、背景图到内层情节结构、特效运镜的智能编排。结合分布式服务架构与微服务设计,确保高并发场景下的视频处理流畅性,支持极速版、专业版、探索版等多模式剪辑,满足从商业批量混剪到专业精剪的全场景需求。
飞搜侠是专注于飞书文档搜索的高效工具,帮助用户快速找到所需的高质量飞书文档资源。具备智能搜索功能,能精准匹配用户输入的关键词,快速定位相关文档,提供一键访问链接,方便用户实时预览文档内容。飞搜侠支持移动端应用,用户可以随时随地进行搜索,适合移动办公和学习场景。热门搜索内容涵盖Prompt合集、AI工具、自媒体创业、职场技能、运营技巧和个人成长等多个领域,能满足不同用户的需求。 飞搜侠的主要功能
RoboBrain 2.0 是强大的开源具身大脑模型,能统一感知、推理和规划,支持复杂任务的执行。RoboBrain 2.0 包含 7B(轻量级)和 32B(全规模)两个版本,基于异构架构,融合视觉编码器和语言模型,支持多图像、长视频和高分辨率视觉输入,及复杂任务指令和场景图。模型在空间理解、时间建模和长链推理方面表现出色,适用机器人操作、导航和多智能体协作等任务,助力具身智能从实验室走向真实场景
RoboOS 2.0 是智谱开源的跨本体大小脑协同框架,专为具身智能设计。框架支持多机器人协作,基于集成MCP协议和无服务器架构实现轻量化部署,降低开发门槛。框架包含基于云计算的大脑模块,负责高级认知与多智能体协同;分布式小脑模块群,专司机器人专项技能执行;及实时共享内存机制,强化环境态势感知能力。RoboOS 2.0 提供标准化接口,消除硬件适配差异,用技能商店实现机器人技能模块的智能匹配与一键
Agnes AI 是基于 AI 的新一代协作办公平台,能彻底改变传统办公模式。Agnes AI用团队记忆、智能协作和一体化内容生成,打造适配团队场景的工作空间。用户能多人实时编辑文档、报告或 PPT,AI 能自动完成资料收集、大纲生成、内容填充等任务。Agnes AI 自研 7B 推理模型和多智能体推理框架,专注于团队协作场景,支持长上下文和多轮推理,大幅降低 Token 成本,提升任务完成率。A
文兜智写是专为招投标行业设计的AI标书制作工具。能快速解析招标文件,精准识别关键信息,自动生成符合要求的标书内容,涵盖技术方案、实施方案和商务响应等部分。核心技术依托海量语料库和行业级模型,可实现10分钟内生成10万字的投标方案,查重率低至5%。文兜智写支持多种编写模式,满足不同用户需求,适用于建筑工程、信息技术、智慧城市等众多行业。用户只需输入招标要求,可在网页端、客户端或WPS端快速生成初稿。
EXAONE 4.0是韩国LG AI Research推出的自研混合推理大模型。模型融合通用自然语言处理和高级推理能力,支持韩语、英语和西班牙语。模型分为32B的专业版和1.2B的端侧版,前者基于多项国家级认证考试,适用高专业领域,后者体积小、性能优,支持本地运行,适合隐私和安全要求高的场景。EXAONE 4.0在国际高难度基准测试中表现优异,如MMLU-Pro 81.8分、AIME 2025 8
VikingDB 是火山引擎推出的高性能向量数据库,专为处理海量高维向量数据设计。VikingDB 支持实时同步、异步写入等多种数据写入方式,具备自研的 HNSW、IVF 等高效索引算法,可实现百亿级向量的毫秒级检索,兼容稠密与稀疏向量检索。VikingDB 提供 SaaS 控制台、API 和多种语言的 SDK,支持自动弹性扩容,广泛应用在多模态搜索、智能推荐、RAG 场景及记忆库构建等领域,助力
Voxtral 是 Mistral AI 推出的先进音频模型,基于卓越的语音转录和深度理解能力,推动语音作为自然的人机交互方式。Voxtral提供 24B 和 3B 两种版本,分别适用生产规模和本地部署。Voxtral 支持多语言、长文本上下文、内置问答和总结功能,能直接触发后端功能调用。Voxtral 性能在多个基准测试中超越现有开源模型和专有 API,同时成本更低,广泛应用在各种场景,助力语音
只显示前20页数据,更多请搜索
Showing 361 to 384 of 399 results