关键词 "音频" 的搜索结果, 共 3 条, 只显示前 480 条
Percify 是强大的 AI 数字人生成平台,专注于创建逼真的虚拟形象(avatar)视频内容。用户上传一张人脸图片和音频,通过简单的文字描述,能生成具有自然表情、精准口型同步和高质量语音的无限时长视频。平台能满足从初学者到专业创作者的需求,支持高清视频导出和语音克隆等功能。Percify 适用艺术家、品牌、游戏开发者等,帮助用户快速生成高质量的虚拟形象和视频内容,提升创作效率。Percify的
Veo 3.1 是谷歌推出的最新 AI 视频生成模型,在Veo 3基础上进行了重大升级,带来更丰富的音频支持、更强的叙事控制及更逼真的质感还原。通过原生音频生成和更精细的编辑能力,Veo 3.1 让用户能直接在生成阶段完成视频创作,无需后期处理。模型支持多种输入类型,包括文本提示、图像和视频片段,能生成高质量的 720p 或 1080p 视频。Veo 3.1 的目标是简化创意生产流程,为创作者提供
SongBloom 是腾讯 AI Lab 开发的全长度歌曲生成框架,结合了自回归草图绘制和基于扩散的细化技术,通过交错生成范式(Interleaved Generation)交替生成语义和声学上下文,生成高质量的完整歌曲。模型只需输入 10 秒音频样本和对应歌词,即可生成长达 2 分 30 秒的双通道、48kHz 音频。SongBloom 在音频质量和歌词准确性方面表现出色,接近领域最佳水平(SO
只显示前20页数据,更多请搜索
Showing 193 to 195 of 195 results