关键词 "文本生成交互式 3D 场景" 的搜索结果, 共 24 条, 只显示前 480 条
Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同,基于逐步细化噪声生成输出,能快速迭代纠正错误,让Gemini Diffusion在文本生成任务中表现出色,具备快速响应、生成更连贯文本和迭代细化等能力。Gemini Diffusion性能在外部基准测试中与更大规模模型相当,速度更快。Gemini Diffusion作为实验性演示提供,用户加入等待名单
蝉镜是营销数据分析平台蝉妈妈旗下推出的一款AI数字人短视频与直播平台,通过极速克隆技术和高效的内容生产流程,使用户能够快速创建并发布数字人短视频。用户只需上传简短视频和文案,即可生成具有个性化数字人形象的视频内容。蝉镜平台还提供了智慧直播功能,支持7*24小时不间断的直播互动,适配多种场景和模板,大幅降低了视频制作和直播的门槛,为电商和内容创作者提供了新的营销和表达手段。 蝉镜的主要功能
KreadoAI是一个AIGC数字营销视频创作平台,专注于利用人工智能技术简化和优化视频内容的创作流程。用户只需输入文本或关键词,Kreado AI能创作出真实或虚拟人物的视频内容。平台提供超过 700 种数字人形象和 1600 多种语音选项,支持 140 多种语言,广泛应用于营销、教育、培训、医疗等领域。 KreadoAI 的最新版本增加了真人语音克隆、真人形象克隆、PPT 文件生成数字人口播视
通义万相AI视频是阿里推出的一款完全免费的AI视频生成工具,支持文生视频和图生视频两种方式,可以根据用户提供的文字提示词或图片,自动创作出具有影视级画面质感的高清视频(最长6秒)。通义万相AI视频支持多种艺术风格,包括但不限于古风、科幻、动画等,并且特别优化了对中式元素的理解和表现。通义万相AI视频能处理多语言输入,支持“灵感扩写”功能,一键帮用户完善提示词,还自带“音频生成”功能,视频生成自带音
BnbIcons是AI驱动的图标生成工具,能创建类似Airbnb风格的等轴测图标。用户只需输入文字描述或上传参考图片,AI能生成符合要求的图标。提供464+个预制图标,涵盖多种类别和风格,可快速找到所需图标。用户可以批量创建图标,输入一系列类别,可生成整套匹配的图标,节省设计时间。 BnbIcons的主要功能 AI辅助图标生成:通过AI技术,根据用户输入的文本描述或上传的参考图片,快速
3DTown 是哥伦比亚大学联合Cybever AI等机构推出的从单张俯视图生成3D城镇场景框架。框架基于区域化生成和空间感知的3D修复技术,将输入图像分解为重叠区域,基于预训练的3D对象生成器分别生成每个区域的3D内容,基于掩码修正流修复过程填补缺失的几何结构,同时保持结构连续性。3DTown 支持生成具有高几何质量和纹理保真度的连贯3D场景,在多种风格的场景生成中表现出色,优于现有的先进方法。
有言是由魔珐科技推出的一个一站式AIGC视频创作和3D数字人生成平台,通过提供海量超写实3D虚拟人角色,帮助用户无需真人出镜即可制作视频。该平台基于魔珐自研的AIGC技术,支持用户输入文字快速生成3D内容,并提供自定义编辑、字幕、动效、背景音乐等后期包装功能,简化视频制作流程,让创作变得高效而有趣。 有言的主要功能 一站式服务:有言整合了从内容生成到后期制作的全套流程,为用户提供了从开始到
VibeNecto是AI营销视觉素材生成平台。能根据用户输入的文本描述,快速生成高质量的定制化图片,适用于社交媒体、广告等多种营销场景。用户无需专业设计技能,可在几秒钟内获得符合品牌风格的视觉素材。平台提供多种视觉风格选择,从写实到艺术风格,满足不同需求。具备背景移除功能,可自动去除图片背景,适合产品照片和专业头像处理。所有生成的图片都会被安全地存储在云端,自动保存历史记录,方便用户随时访问、下载
新华社国家重点实验室作为媒体领域战略科技创新平台,围绕推进媒体融合发展、重塑新闻舆论格局国家重大战略需求,聚焦人工智能等先进技术在新闻生产全流程应用,面向跨媒体大规模感知认知信息分析与推理、人机协同复杂问题分析响应及评估两个方向,开展媒体融合生产技术应用基础研究。 新华融合媒体科技发展(北京)有限公司,是新华社媒体融合生产技术与系统国家重点实验室运营主体。 主要功能: 四大场景,三类运
心流是阿里巴巴推出的基于星辰大模型的AI搜索助手,通过智能技术提升用户的知识获取效率。集成了近3000万篇学术论文资源,覆盖Nature、IEEE、ArXiv等权威期刊,支持学术问答、AI精读、段落总结、智能翻译和名词解释等功能,能帮助研究人员和学生快速理解和分析论文内容。心流提供DeepSeek渠道,联网搜索协助思考过程,具备通用问答、慢推理、私人知识库等功能,适用于市场调研、文档分析、内容创作
点点是小红书推出的AI搜索应用,主打生活服务场景的聚合搜索。提供生活搜索助手功能,能贴心地帮助用户找到并总结出日常生活中遇到的问题的答案。具有“哪里不‘会’点哪里”的功能,支持用户在回答中点击感兴趣的部分,进一步提问。还提供超级避坑指南、全网真实声音、及时性的信息等功能。提供有画面感的对话体验,支持拍照提问和视频回复,提升用户体验。 点点的主要功能 生活搜索助手:点点拥有全网全面的生活经验
Kilo Code 是开源的VS Code AI Agent扩展程序,提升开发人员的编码效率。具备强大的代码生成能力,能根据自然语言描述快速生成代码片段,有效减少手动编写代码的时间。Kilo Code 能自动化执行多种重复性编码任务,例如代码格式化、重构以及生成样板代码等,进一步提高开发效率。内置最新的AI模型,如Claude和 Gemini 2.5 Pro,无需用户手动配置API密钥,提供MCP
OpusClip Thumbnail 是 OpusClip 团队推出的免费的 AI 缩略图生成工具,专为 YouTube 创作者设计,用于快速生成视频缩略图。用户只需粘贴视频链接,AI 会自动分析内容并生成多个高表现力的缩略图选项,无需手动输入提示词或描述。基于顶级创作者的成功模式训练,吸引观众注意力提高点击率。 OpusClip Thumbnail的主要功能 一键生成:用户只需粘贴 Yo
剪小映是抖音推出的AI视频剪辑应用,专为零基础用户设计,操作简单便捷。具备AI智能解析功能,可精准识别素材中的场景、人物等元素,为用户提供智能剪辑指引。通过自动化成片功能,用户能快速生成高质量视频。支持智能优化,自动调整素材比例、亮度及音频节奏,提升视频效果。用户可以在智能生成的基础上进行个性化调整,如更换素材、修改字幕等,满足不同需求。 剪小映的主要功能 AI智能解析:能深度解析用户素材
QwenLong-L1-32B 是阿里巴巴集团 Qwen-Doc 团队推出的,基于强化学习训练的首个长文本推理大模型。模型基于渐进式上下文扩展、课程引导的强化学习和难度感知的回顾性采样策略,显著提升在长文本场景下的推理能力。模型在多个长文本文档问答(DocQA)基准测试中表现优异,平均准确率达到了70.7%,超越OpenAI-o3-mini和Qwen3-235B-A22B等现有旗舰模型,且与Cla
Cartwheel 是 AI 3D 动画生成平台,基于文本到动画(Text-to-Motion)技术,让用户仅需输入文本描述,快速生成高质量的 3D 角色动画。平台结合深度学习模型与传统动画技术,支持动作捕捉、自动化运动合成,与主流 3D 软件无缝集成。Cartwheel 的目标是简化 3D 动画制作流程,帮助动画师和艺术家节省时间,专注于创造性工作。 Cartwheel的主要功能 文本驱
Slidev 是开源的PPT制作模型,基于 Markdown + Vue 技术栈实现。工具支持用简单的 Markdown 语法创建幻灯片,支持代码高亮、实时编码演示、数学公式渲染、图表生成等功能,提供丰富的主题和样式选项。Slidev 提供快速启动命令 npm init slidev,支持在线编辑器 sli.dev/new,无需安装软件简单易用。Slidev 的核心优势在于开发友好性和强大的交互性
PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主持人、嘉宾和编剧)自动生成丰富且结构化的对话内容。PodAgent构建了多样化的声音库,用在精准匹配角色与声音,确保音频的自然度和沉浸感。PodAgent 引入基于大语言模型(LLM)的语音合成技术,生成富有表现力和情感的语音,让播客更具吸引力。PodAgent 推出了全面的评
幻舟AI是一站式AI短片创作平台,支持批量生成广告片、宣传片、动画片等。基于Midjourney、Runway等全球领先的AI模型,实现剧本创作、角色设计、分镜生成及视频制作的全流程服务。平台支持多种模型切换,满足不同风格和场景需求。幻舟AI高效整合创作资源,简化操作流程,提升创作效率,是影视创作者的有力工具。 幻舟AI的主要功能 剧本创作:自动生成故事剧本和分镜图,支持自定义编辑。 角
PxBee 是在线AI图片编辑平台,基于先进的人工智能技术,帮助用户快速移除图片背景、增强图片质量以及生成新的背景。用户只需上传图片,PxBee 的 AI 工具能自动识别并移除背景,在复杂的图像上也能保持边缘的精确性。平台提供一键式的图片增强功能,能修复模糊的照片、减少噪点、改善光照提升分辨率,让用户快速获得高清清晰度的效果。 PxBee的主要功能 AI背景移除:PxBee 的 AI 工具
TripoSG 是 VAST-AI-Research 团队推出的基于大规模修正流(Rectified Flow, RF)模型的高保真 3D 形状合成技术, 通过大规模修正流变换器架构、混合监督训练策略以及高质量数据集,实现了从单张输入图像到高保真 3D 网格模型的生成。TripoSG 在多个基准测试中表现出色,生成的 3D 模型具有更高的细节和更好的输入条件对齐。 TripoSG的主要功能
# 核心亮点 支持最强开源模型千问3,其代码能力达到业界领先水平,同时支持MCP协议,具备强大的工具调用能力,可以帮助开发者快速开发智能体应用。 全面集成通义灵码智能编码助手(即通义灵码插件)的能力,无需安装插件开箱即用,直接体验高效、智能的编程体验。 自带编程智能体模式,开发者只需描述编码任务,通义灵码便可以自主地进行工程感知、代码检索、执行终端、调用MCP工具等,
字节跳动旗下剪映团队近期推出了一款面向短视频创作者、电商营销人员以及普通用户的视频内容创作 Agent,名为「小云雀 AI」,主打“灵感即所得,创作零门槛”。「小云雀AI」已经接入豆包和DeepSeek,目前仅安卓可下载,iOS 预计 6 月发布。 不同于传统 AI 工具仅提供一个通用输入框,「小云雀AI」先让用户明确选择场景(如智能成片、数字人视频、AI 设计、AI 换背景等),以此避免生成内
银河通用发布全球首个产品级端到端具身 FSD 大模型 ——TrackVLA,一款具备纯视觉环境感知、语言指令驱动、可自主推理、具备零样本(Zero-Shot)泛化能力的具身大模型。 TrackVLA 是银河通用推出的产品级导航大模型,纯视觉环境感知、自然语言指令驱动、端到端输出语言和机器人动作,是一个由仿真合成动作数据训练的“视觉-语言-动作”(Vision-Language-Action, V
只显示前20页数据,更多请搜索
Showing 313 to 336 of 371 results