ZipVoice-零样本单说话人语音合成模型

ZipVoice-零样本单说话人语音合成模型

访问网站

小米集团AI实验室新一代 Kaldi 团队发布了基于 Flow Matching 架构的ZipVoice系列语音合成(TTS)模型——ZipVoice(零样本单说话人语音合成模型)ZipVoice-Dialog(零样本对话语音合成模型)

作为 zipformer 在语音生成任务上的应用和探索,ZipVoice解决了现有零样本语音合成模型的参数量大、合成速度慢的痛点,在轻量化建模和推理加速上取得了重要突破。ZipVoice-Dialog 则解决了现有对话语音合成模型在稳定性和推理速度上的瓶颈,实现了又快又稳又自然的语音对话合成。

模型性能

我们在零样本语音合成模型评测常用的LibriSpeech-PC test-clean、Seed-TTS test-en和test-zh测试集上与现有的多个SOTA(state-of-the-art)模型进行了对比。

实验结果表明,ZipVoice和ZipVoice-Distill在具备更小参数量和更快推理速度的同时,在三个客观指标,即说话人相似度(SIM-o)、词错误率(WER)和UTMOS,以及两个主观指标(CMOS、SMOS)上都极具竞争力,达到了零样本语音合成模型的SOTA性能水平,同时显著减少了模型参数量,加快了推理速度。

ZipVoice零样本语音合成模型具备了低参数量、高推理速度、高语音质量三大优点,ZipVoice-Dialog提供了又快又稳又好的对话语音合成新方案。ZipVoice系列模型为轻量化、高速度要求的语音交互应用场景提供了新的解决方案。

ChatterBoxTTS---专业-ai-语音合成平台,将文本瞬间转换为自然语音

ChatterBoxTTS---专业-ai-语音合成平台,将文本瞬间转换为自然语音

<p><br></p>

LeVo

LeVo

<p>LeVo是腾讯AI实验室推出的AI唱歌模型,具备强大的音色克隆能力,仅需3秒音频即可精准复制目标音色,包括音调、情感和韵律,无需大量训练数据。LeVo支持分轨生成,可分别生成人声和伴奏音轨,为后期编辑提供便利。技术架构基于语言模型(LM),结合LeLM和音乐编解码器,能并行生成音轨,音质表现接近行业领先水平,在歌词对齐能力上表现卓越。</p> <h2 style="font-size: 20px;">LeVo的项目地址</h2> <ul> <li>项目官网: <a href="https://levo-demo.github.io/" target="_blank" rel="noopener">https://levo-demo.github.io/</a>  </li> </ul>

AiMakeSong

AiMakeSong

<p>AiMakeSong 是基于人工智能的音乐和歌曲生成平台,支持用户通过简单的文本输入或歌词创作来生成高质量的音乐作品。用户可以选择将文字描述转化为音乐,或者将自己创作的歌词转化为完整的歌曲。平台提供了多种音乐风格和声音选项,包括流行、摇滚、说唱、古典等,以及男性、女性或乐器声音,满足不同用户的需求。</p> <h2 style="font-size: 20px;">AiMakeSong的主要功能</h2> <ul> <li> <div class="paragraph">文本转音乐:用户可以通过描述自己的音乐想法,将这些想法转化为音乐。AI会根据描述生成相应的音乐。</div> </li> <li> <div class="paragraph">歌词转音乐:用户可以输入自己的歌词,或者使用平台的AI歌词生成器来创作歌曲。输入一首歌的歌词,AI会为这些歌词配上旋律和伴奏。</div> </li> <li> <div class="paragraph">声音选择:可以选择男性、女性声音,或者选择乐器(如钢琴、吉他)作为歌曲的“声音”。</div> </li> <li> <div class="paragraph">风格选择:可以选择流行、摇滚、说唱、古典等多种音乐风格。能通过选择不同的风格来实现。</div> </li> <li> <div class="paragraph">免费去除人声:可以轻松分离或移除任何曲目中的人声。</div> </li> <li> <div class="paragraph">带人声的AI音乐生成器:可以添加专业人声到曲目中,或者整合用户自己的声音。</div> </li> </ul> <h2 style="font-size: 20px;">AiMakeSong的官网地址</h2> <ul> <li>官网地址:<a class="external" href="https://www.aimakesong.com/?utm_source=medsci" target="_blank" rel="noopener">aimakesong.com</a></li> </ul>

Tarteel

Tarteel

Recite the Quran confidently with live feedback and AI assistance.