OpenAudio S1

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于超过200万小时的音频数据训练,支持13种语言。采用双自回归(Dual-AR)架构和强化学习与人类反馈(RLHF)技术,生成的声音高度自然、流畅,几乎与人类配音无异。模型支持超过50种情感和语调标记,用户可通过自然语言指令灵活调整语音表达。OpenAudio S1支持零样本和少样本语音克隆,仅需10到30秒的音频样本

DubbingX

DubbingX

智声云配(DubbingX) 是 AI 智能配音工具,提供语音合成(TTS)、音色迁移、歌声转换等多种功能。工具支持中文、英文、日文、粤语等多语言,拥有近2500种情绪语态,支持高度定制,满足游戏、影视、动漫、有声书等多场景需求。工具音色版权合规,支持商用,能显著降低配音成本。智声云配结合专业高校和全球配音演员资源,致力于为用户提供高质量、多样化的音频解决方案。 智声云配官网:https://d

Spark-TTS

Spark-TTS

<p>Overview Spark-TTS 是由出门问问(Mobvoi)联合多所顶尖学术机构(如香港科技大学、上海交通大学)最新推出的新一代语音合成模型,其核心创新在于BiCodec编码技术和与文本大模型的结构统一性,利用大型语言模型 (LLM) 的强大功能实现高度准确且自然的语音合成。</p> <p>Spark-TTS is an advanced text

LilyFM

LilyFM

LilyFM是创新的AI应用,能将网页文章转化为播客。应用基于先进的AI技术,将用户待读的文章内容转化为生动的音频,提供深度分析和提炼关键要点,帮助用户更高效地获取知识。LilyFM逼真的AI语音支持多种语言,提供自然、富有表现力的朗读体验。用户基于Share Extension一键保存文章到播放队列,随时随地在通勤、健身或休息时收听。LilyFM让稍后阅读转变为稍后收听,让知识获取更加便捷和轻松

CosyVoice

CosyVoice

FunAudioLLM/CosyVoice(https://github.com/FunAudioLLM/CosyVoice) 项目是一个开源的多语言语音生成模型,它支持推理、训练和部署全流程。 该模型包括 CosyVoice-300M、CosyVoice-300M-SFT 和 CosyVoice-300M-Instruct 三种预训练模型,以及 CosyVoice-ttsfrd 资源。用户

AudioGenie

AudioGenie

AudioGenie是腾讯AI Lab团队推出的多模态音频生成工具,能从视频、文本、图像等多种模态输入生成音效、语音、音乐等多种音频输出。工具采用无训练的多智能体框架,通过生成团队和监督团队的双层架构实现高效协同。生成团队负责将复杂的输入分解为具体的音频子事件,通过自适应混合专家(MoE)协作机制动态选择最适合的模型进行生成。监督团队则负责时空一致性验证,通过反馈循环进行自我纠错,确保生成的音频高

FlowSpeech

FlowSpeech

FlowSpeech 是创新的 AI 文本转语音(TTS)工具,专注于将书面语转换为自然流畅的口语。通过上下文感知和多模态技术,解决了传统 TTS 在语调变化和情感表达上的不足,让 AI 生成的语音听起来更生动、自然。FlowSpeech 具备智能内容筛选功能,能自动识别并剪裁不适合朗读的内容,如广告信息和无意义字符串,显著提升语音输出质量。 如何使用FlowSpeech 网页端使用

Boomy

Boomy

Easy music generation with AI on Boomy platform.

GPT-SoVITS

GPT-SoVITS

1分钟语音数据也可以用来训练一个好的TTS模型!(少量声音克隆).零样本 TTS:输入 5 秒的声音样本并体验即时文本到语音的转换。 Github上超过4万个星星

ThinkSound

ThinkSound

ThinkSound是阿里通义语音团队推出的首个CoT(链式思考)音频生成模型,用在视频配音,为每一帧画面生成专属匹配音效。模型引入CoT推理,解决传统技术难以捕捉画面动态细节和空间关系的问题,让AI像专业音效师一样逐步思考,生成音画同步的高保真音频。模型基于三阶思维链驱动音频生成,包括基础音效推理、对象级交互和指令编辑。模型配备AudioCoT数据集,包含带思维链标注的音频数据。在VGGSoun

LOVO AI

LOVO AI

AI语音生成器是什么 AI语音生成器是一种利用人工智能技术将文本转换为语音的工具Genny是LOVO AI开发的一款先进的AI语音生成器,它具备500+种声音和100种语言的支持,能够为视频、营销、培训、社交媒体等内容创作提供高质量的语音Genny的特点在于其超逼真的声音,几乎无法与真实人类的声音区分开来 AI语音生成器的主要功能和特点  Genny的主要功能和特点包括: 超逼真的AI声音,支

Mureka

Mureka

AI music creation platform 昆仑万维正式上线Mureka V7.5模型。模型在中文歌曲创作上取得重大突破,提升了音色与演奏技法,优化了咬字和情感表现。通过ASR技术精准捕捉演唱细节,使AI演绎的歌曲更贴近真人演唱,显著增强了自然度和情感深度。

SongGenerator.io: AI Music Generator Free Online

SongGenerator.io: AI Music Generator Free Online

Transform text into royalty-free AI music quickly

BeatBot

BeatBot

Compose unique songs using AI technology.

Wondera

Wondera

Personalized music with your unique AI voice.

Kits AI

Kits AI

Transform your voice with AI artist voices. Create and train your own AI voice model.

Uberduck

Uberduck

Uberduck is an AI music production platform with realistic voices and custom options.

The Papaya

The Papaya

AI platform connecting musicians with resources and insights.

Make Best Music

Make Best Music

AI-powered music production suite

audoir.com

audoir.com

Generate lyrics, music, and songs with AI

Songtell

Songtell

Discover the meaning of your favorite songs with Songtell's AI-powered platform.

Suno AI Music Generator

Suno AI Music Generator

Generate music using Suno AI

AI Song

AI Song

Unlock musical creativity with AI

SunoAI.ai

SunoAI.ai

Create unique AI MP3 songs instantly

只显示前20页数据