关键词 "高质量" 的搜索结果, 共 15 条, 只显示前 480 条
腾讯优图实验室进一步开源 Youtu-GraphRAG——这是一款全新的图检索增强生成框架,主打大语言模型+GraphRAG模式,把知识组织成「图谱」,再交给大语言模型去检索和推理,帮助大模型在处理复杂问答类任务时减少「胡言乱语」,回答更精准、更可追溯。它尤其适用于企业知识库问答、科研文档解析、个人知识库、私域知识管理等知识密集型场景。要减少胡编乱造,关键在于更精准的检索与推理。Youtu-Gra
通义DeepResearch 是阿里巴巴推出的开源深度研究智能体,专为长周期、深度信息检索任务设计。拥有 300 亿参数,每次激活 30 亿参数,支持 ReAct 模式和深度模式(Heavy Mode),后者通过迭代研究范式(IterResearch)提升复杂推理能力。智能体采用全流程合成数据方案,无需人工干预即可生成高质量数据集,突破智能体能力上限。训练流程涵盖智能体持续预训练(Agentic
Orchids 是全球首款具备全栈开发能力的 AI 工具,能实现从前端到后端的全流程开发。工具在 UI 设计和全栈开发性能上表现卓越,超越多个主流竞品,如 Lovable、Bolt、v0 等。用户无需依赖外部服务,能构建原型、设计 UI 模型,生成完整应用程序与网站。Orchids 的出现,有望推动开发者更专注于创意实现,减少重复性编码工作,为全栈开发领域带来新的变革。Orchids的主要功能全栈
Ray3是Luma AI推出的新一代视频生成模型,具备强大的推理能力和专业级HDR视频生成技术,为视频创作带来了革命性的变化。Ray3能理解图像和语言指令,执行复杂任务,自动评估和优化输出质量,确保生成的视频达到高标准。支持的10位、12位甚至16位色深以及EXR格式输出,生成的视频在色彩和细节上更加丰富和逼真,完美适配专业影视制作和高端内容创作的需求。Ray3引入了草稿模式,可以在短时间内生成视
Fish Speech 是一款由 Fish Audio 开源的文本转语音(TTS)工具,支持中、英、日三国语言。它经过 15 万小时的多语种数据训练,能生成接近人类水平的自然语音。其最新版本为 1.2,拥有以下核心优势:核心功能与技术亮点高效且低门槛:只需 4GB 显存即可运行,极大地降低了硬件要求。此外,快速的推理速度能让您在短时间内获得所需的语音输出,提升了整体使用体验。支持多种模型:集成了包
CWM(Code World Model)是 Meta 开源的一个拥有 320 亿参数的代码语言模型。它率先将“世界模型”的概念引入代码生成领域,让模型能够通过模拟代码执行过程,更深层次地理解和生成代码,而不仅仅是基于模式匹配。CWM 在多项基准测试中表现出色,例如在 Math-500 数据集上取得了 96.6% 的准确率。该模型的权重已公开,旨在推动代码生成和理解领域的研究,并帮助开发者更高效地
Qianfan-VL 是百度智能云千帆专为企业级多模态应用场景打造的视觉理解大模型。它提供 3B、8B 和 70B 三种尺寸,不仅具备出色的通用能力,还针对 OCR、教育等垂直领域进行了专项强化。该模型基于开源模型,并在百度自研的昆仑芯 P800 上完成了全流程计算任务,展现出卓越的性能和效率。核心功能多尺寸模型:提供从轻量级到大规模的三种版本,满足不同企业和开发者的需求,适用于各种场景,从端上实
Rocket.new 是一款革命性的 AI 编程平台,专注于帮助用户快速构建和部署全功能的 Web 和移动应用。您只需用简单的提示描述您的需求,Rocket.new 就能自动生成完整的应用,包括后端集成、数据库架构、API 端点和高质量代码。该平台的核心优势在于其深度集成和高效自动化能力,它能进行市场研究、优化用户体验,并提供高质量模板,帮助您快速启动项目。Rocket.new 的用户群体遍布美国
# Framepack AI:革命性的AI视频生成模型Framepack AI是一种突破性的神经网络结构,用于AI视频生成。它采用创新的“下一帧预测”技术,并结合独特的固定长度上下文压缩机制,使用户能够生成高质量、高帧率(30fps)的视频,长度可达120秒,且硬件门槛极低(仅需配备6GB VRAM的消费级NVIDIA GPU)。## Framepack AI的独特之处是什么?Framepack
Sketch To | AI 图像转素描转换器使用我们强大且免费的 AI 生成器,立即将您的照片转化为艺术品,让您的素描草图焕发生机。核心功能:1. 双重 AI 驱动: 将任何照片转换为细节丰富的素描,或者反转此过程,将您的画作转变为逼真的照片级图像。2. 标准模型永久免费: 获得高质量的创意转换效果,完美适用于社交媒体、创意项目和业余爱好——完全免费,永不过期。3. 专业模型升级: 解锁世
Strawberry 是创新的 AI 自动化浏览器,为用户提供高效、智能的工作流程解决方案。通过多种预设的 AI 助手,如销售助手(Sales Sally)、招聘助手(Recruiter Ryan)、数据提取器(Extractor Ella)等,帮助用户在不同领域实现任务自动化。例如,销售助手可以自动寻找高质量潜在客户并生成个性化推广信息;招聘助手能快速筛选候选人并起草职位描述。用户可以根据自身需
Percify 是强大的 AI 数字人生成平台,专注于创建逼真的虚拟形象(avatar)视频内容。用户上传一张人脸图片和音频,通过简单的文字描述,能生成具有自然表情、精准口型同步和高质量语音的无限时长视频。平台能满足从初学者到专业创作者的需求,支持高清视频导出和语音克隆等功能。Percify 适用艺术家、品牌、游戏开发者等,帮助用户快速生成高质量的虚拟形象和视频内容,提升创作效率。Percify的
Veo 3.1 是谷歌推出的最新 AI 视频生成模型,在Veo 3基础上进行了重大升级,带来更丰富的音频支持、更强的叙事控制及更逼真的质感还原。通过原生音频生成和更精细的编辑能力,Veo 3.1 让用户能直接在生成阶段完成视频创作,无需后期处理。模型支持多种输入类型,包括文本提示、图像和视频片段,能生成高质量的 720p 或 1080p 视频。Veo 3.1 的目标是简化创意生产流程,为创作者提供
SongBloom 是腾讯 AI Lab 开发的全长度歌曲生成框架,结合了自回归草图绘制和基于扩散的细化技术,通过交错生成范式(Interleaved Generation)交替生成语义和声学上下文,生成高质量的完整歌曲。模型只需输入 10 秒音频样本和对应歌词,即可生成长达 2 分 30 秒的双通道、48kHz 音频。SongBloom 在音频质量和歌词准确性方面表现出色,接近领域最佳水平(SO
Hitem3D 是 AI 驱动的 3D 模型生成工具。工具结合 ULTRA3D 的高效性和 Sparc3D 的高精度,能将用户上传的图片快速转化为高质量的 3D 模型,适用游戏开发、电商展示、工业设计、教育研究等多种场景。基于先进的技术,Hitem3D 实现了从 2D 到 3D 的无缝转换,为创作者、设计师和开发者提供一个高效、低成本的解决方案,助力快速实现创意和项目落地。Hitem3D的官网地址
只显示前20页数据,更多请搜索
Showing 121 to 135 of 135 results