关键词 "高质量" 的搜索结果, 共 24 条, 只显示前 480 条
AI Book Translate是一款高保真度的多通AI翻译工具,可在几小时内完成整本书的翻译,几乎达到出版标准。它使用递归精炼循环,模仿人类翻译者的工作方式,为作者、编辑和小团队提供高质量、经济实惠的翻译服务。 需求人群: 适合作者、编辑和小团队,希望获得高质量、保留原意和修辞忠实的书籍翻译服务。 使用场景示例: 作者需要将自己的作品翻译成多种语言进行出版。 出版商希
腾讯元器是腾讯混元大模型团队推出的智能体开放平台,开发者可以通过插件、知识库、工作流等方式快速、低门槛打造高质量的智能体,支持发布到QQ、微信等平台,同时也支持API调用。 类似COZE,Dify,Cherry Studio的智能体开发平台
昆仑万维面向全球市场,同步发布天工超级智能体(Skywork Super Agents)。这款产品采用了AI agent架构和deep research技术,能够一站式生成文档、PPT、表格(excel)、网页、播客和音视频多模态内容。它具有强大的deep research能力,在GAIA榜单上排名全球第一,超过了OpenAI Deep Research和Manus。 天工超级智能体(Skywo
BookFab AudioBook Creator is an AI text-to-speech tool designed for producing high-quality audiobooks, podcasts and read-aloud content. It supports importing TXT or EPUB files and converting them to a
Devstral是Mistral AI和All Hands AI推出的专为软件工程任务设计的编程专用模型。Devstral在解决真实世界软件问题上表现出色,在SWE-Bench Verified基准测试中,得分46.8%大幅领先其他开源模型。Devstral支持处理复杂代码库中的上下文关系、识别组件间联系及发现细微的代码错误。Devstral轻量级,能在单个RTX 4090或32GB内存的Mac上
MMaDA(Multimodal Large Diffusion Language Models)是普林斯顿大学、清华大学、北京大学和字节跳动推出的多模态扩散模型,支持跨文本推理、多模态理解和文本到图像生成等多个领域实现卓越性能。模型用统一的扩散架构,具备模态不可知的设计,消除对特定模态组件的需求,引入混合长链推理(CoT)微调策略,统一跨模态的CoT格式,推出UniGRPO,针对扩散基础模型的统
Sparkify是谷歌推出的AI动画视频生成工具,基于Gemini 2.5和Veo 2模型。用户输入问题或复杂概念后,Sparkify能在2分钟内生成直观的动画短视频,讲解知识点。Sparkify多模态处理能力结合Google Search数据,确保内容准确且与最新信息同步。Sparkify适用于教育、科普和企业培训等领域,提升理解效率和传播效果。Sparkify目前处于内测阶段,访问官网加入等候
BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,其中70亿为活跃参数。采用混合变换器专家架构(MoT),通过两个独立编码器分别捕捉图像的像素级和语义级特征。BAGEL遵循“下一个标记组预测”范式进行训练,使用海量多模态标记数据进行预训练,包括语言、图像、视频和网络数据。在性能方面,BAGEL在多模态理解基准测试中超越了Qwen2.5-VL和InternVL-2.5等顶级开源视觉语言模型
AutoBE 是 AI 驱动的后端服务器代码生成工具,通过用户描述需求自动生成高质量的后端代码。基于 TypeScript、NestJS、Prisma 和 Postgres 等技术栈构建,强调“氛围编码”(Vibe Coding),通过持续的用户反馈和编译器反馈来迭代优化代码。AutoBE 结合瀑布模型和螺旋模型的优点,确保代码的可靠性和安全性。 AutoBE的主要功能 需求分析(An
Dashtoon是基于人工智能技术的漫画创作应用,简化漫画的创作流程,让创作者能快速生成角色、插画、背景和对话框。通过AI工具,Dashtoon能自动去除背景、增强图像质量,提供故事板到漫画的转换,提升创作效率。Dashtoon提供了平台,让创作者可以发布和变现他们的作品,满足全球读者的需求。新手或是专业漫画家,能轻松创作出高质量的漫画作品。 Dashtoon的主要功能 一致性角色:用户可
DMind是DMind研究机构发布的专为Web3领域优化的大型语言模型。针对区块链、去中心化金融和智能合约等场景深度优化,使用Web3数据微调采用RLHF技术对齐。DMind在Web3专项基准测试中表现优异,性能远超一线通用模型,推理成本仅为主流大模型的十分之一。包含DMind-1和DMind-1-mini两个版本,前者适合复杂指令和多轮对话,后者轻量级,响应快、延迟低,适合代理部署和链上工具。
HRAvatar是清华大学联合IDEA团队推出的单目视频重建技术,支持从普通单目视频中生成高质量、可重光照的3D头像。HRAvatar用可学习的形变基和线性蒙皮技术,基于精准的表情编码器减少追踪误差,提升重建质量。HRAvatar将头像外观分解为反照率、粗糙度和菲涅尔反射等属性,结合物理渲染模型,实现真实的重光照效果。HRAvatar在多个指标上优于现有方法,支持实时渲染(约155 FPS),为数
RelightVid是上海 AI Lab、复旦大学、上海交通大学、浙江大学、斯坦福大学和香港中文大学推出用在视频重照明的时序一致性扩散模型,支持根据文本提示、背景视频或HDR环境贴图对输入视频进行细粒度和一致的场景编辑,支持全场景重照明和前景保留重照明。模型基于自定义的增强管道生成高质量的视频重照明数据对,结合真实视频和3D渲染数据,在预训练的图像照明编辑扩散框架(IC-Light)基础上,插入可
Pippit是字节旗下 CapCut 推出的AI营销内容创作平台,专为电商、社交媒体运营和品牌推广设计。帮助用户轻松生成高质量的视频和图片内容,无需专业设计技能。用户只需输入网页链接或脚本,可快速生成多种营销视频,支持多语言,可批量创作图片。 Pippit提供丰富的商业授权素材库,包括视频模板、图片、设计元素和音频,确保生成内容的合规性。支持一键发布到 TikTok、Instagram 等平台,
蚂上有创意是支付宝推出的AI设计工具,主要面向商家提供AI电商设计服务。蚂上有创意整合支付宝多年积累的高质量素材和模板,将其产品化,让商家能够轻松创建营销素材。蚂上有创意的功能特点包括免费商用素材、AI图像处理工具、口语化对话生图、创意洞察等,降低了AI使用门槛,提升设计效率和商业效果。 蚂上有创意的主要功能 免费商用素材:提供支付宝多年积累的高质量素材和模板,支持在线编辑和内容替换。
Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同,基于逐步细化噪声生成输出,能快速迭代纠正错误,让Gemini Diffusion在文本生成任务中表现出色,具备快速响应、生成更连贯文本和迭代细化等能力。Gemini Diffusion性能在外部基准测试中与更大规模模型相当,速度更快。Gemini Diffusion作为实验性演示提供,用户加入等待名单
有言是由魔珐科技推出的一个一站式AIGC视频创作和3D数字人生成平台,通过提供海量超写实3D虚拟人角色,帮助用户无需真人出镜即可制作视频。该平台基于魔珐自研的AIGC技术,支持用户输入文字快速生成3D内容,并提供自定义编辑、字幕、动效、背景音乐等后期包装功能,简化视频制作流程,让创作变得高效而有趣。 有言的主要功能 一站式服务:有言整合了从内容生成到后期制作的全套流程,为用户提供了从开始到
VibeNecto是AI营销视觉素材生成平台。能根据用户输入的文本描述,快速生成高质量的定制化图片,适用于社交媒体、广告等多种营销场景。用户无需专业设计技能,可在几秒钟内获得符合品牌风格的视觉素材。平台提供多种视觉风格选择,从写实到艺术风格,满足不同需求。具备背景移除功能,可自动去除图片背景,适合产品照片和专业头像处理。所有生成的图片都会被安全地存储在云端,自动保存历史记录,方便用户随时访问、下载
蛙蛙写作是杭州引力智航科技推出的AI小说和内容写作助手,帮助作者提高写作效率和创作质量。蛙蛙写作利用先进的AI技术,为用户提供了一系列写作辅助功能,让创作过程更加便捷和高效。蛙蛙写作的目标是让内容创作变得更加简单,无论是专业作家、自媒体运营者还是普通爱好者,都能通过蛙蛙写作快速产出高质量的作品。 蛙蛙写作的主要功能 蛙蛙写作工具版 AI生成内容:用户只需提供故事的基本元素(如书名
剪小映是抖音推出的AI视频剪辑应用,专为零基础用户设计,操作简单便捷。具备AI智能解析功能,可精准识别素材中的场景、人物等元素,为用户提供智能剪辑指引。通过自动化成片功能,用户能快速生成高质量视频。支持智能优化,自动调整素材比例、亮度及音频节奏,提升视频效果。用户可以在智能生成的基础上进行个性化调整,如更换素材、修改字幕等,满足不同需求。 剪小映的主要功能 AI智能解析:能深度解析用户素材
Cartwheel 是 AI 3D 动画生成平台,基于文本到动画(Text-to-Motion)技术,让用户仅需输入文本描述,快速生成高质量的 3D 角色动画。平台结合深度学习模型与传统动画技术,支持动作捕捉、自动化运动合成,与主流 3D 软件无缝集成。Cartwheel 的目标是简化 3D 动画制作流程,帮助动画师和艺术家节省时间,专注于创造性工作。 Cartwheel的主要功能 文本驱
PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主持人、嘉宾和编剧)自动生成丰富且结构化的对话内容。PodAgent构建了多样化的声音库,用在精准匹配角色与声音,确保音频的自然度和沉浸感。PodAgent 引入基于大语言模型(LLM)的语音合成技术,生成富有表现力和情感的语音,让播客更具吸引力。PodAgent 推出了全面的评
Jodi是中国科学院计算技术研究所和中国科学院大学推出的扩散模型框架,基于联合建模图像域和多个标签域,将视觉生成与理解统一起来。Jodi基于线性扩散Transformer和角色切换机制,执行联合生成(同时生成图像和多个标签)、可控生成(基于标签组合生成图像)及图像感知(从图像预测多个标签)三种任务。Jodi用包含20万张高质量图像和7个视觉域标签的Joint-1.6M数据集进行训练。Jodi在生成
幻舟AI是一站式AI短片创作平台,支持批量生成广告片、宣传片、动画片等。基于Midjourney、Runway等全球领先的AI模型,实现剧本创作、角色设计、分镜生成及视频制作的全流程服务。平台支持多种模型切换,满足不同风格和场景需求。幻舟AI高效整合创作资源,简化操作流程,提升创作效率,是影视创作者的有力工具。 幻舟AI的主要功能 剧本创作:自动生成故事剧本和分镜图,支持自定义编辑。 角
只显示前20页数据,更多请搜索
Showing 49 to 72 of 100 results