AI语音合成 - 梅斯AI导航站

Resemble

Generate synthetic voices that resemble real humans in seconds.

Voiser

Voiser is an AI program that converts text to speech and speech to text with human-like voices.

Texttovoice.online

Convert text to English voices online using AI power.

Rask AI

Rask AI provides top-quality AI video dubbing and localization with 130+ languages.

VidAU

Generate engaging videos in batches within a few minutes

TTSMaker

A free online text-to-speech tool with over 200 AI voices and support for multiple languages.

Text Reader AI

Free text-to-speech with lifelike AI voices.

FakeYou

Generate realistic and natural speech with FakeYou using deep fake technology.

Typecast AI

Typecast is an AI voice generator with 400+ realistic voices for creating lifelike audio content.

Play.ht

PlayHT is an AI Voice Generator platform with over 600 voices in multiple languages.

Deepgram AI Voice Generator

AI voice generator and text-to-speech platform

Deepgram Voice AI

Real-time speech-to-text and text-to-speech APIs powered by Deepgram's voice AI models

Listnr AI

Create voiceovers and videos with AI

SpeechGen.io

Generate high-quality voiceovers with SpeechGen.io's realistic Text-to-Speech AI technology.

Voicemaker

Voicemaker® converts text to human-like voices, offering various voice profiles and customization options.

Spark-TTS

<p>Overview Spark-TTS 是由出门问问（Mobvoi）联合多所顶尖学术机构（如香港科技大学、上海交通大学）最新推出的新一代语音合成模型，其核心创新在于BiCodec编码技术和与文本大模型的结构统一性，利用大型语言模型 (LLM) 的强大功能实现高度准确且自然的语音合成。</p> <p>Spark-TTS is an advanced text

Muyan-TTS

Muyan-TTS，一款低成本、具备良好二次开发支持的模型并完全开源，以方便学术界和小型应用团队的音频技术爱好者。当前开源的Muyan-TTS版本由于训练数据规模有限，致使其仅对英语语种呈现出良好的支持效果。不过，得益于与之同步开源的详尽训练方法，从事相关行业的开发者能够依据自身实际业务场景，灵活地对Muyan-TTS进行功能升级与定制化改造。 01. H

VoiceCanvas

VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务，支持超过 50 种语言，集成 OpenAI TTS、AWS Polly 和 MiniMax 等多种语音服务。VoiceCanvas 提供个人声音克隆功能，用户上传几秒音频样本能创建个性化声音。VoiceCanvas适合内容创作者、教育工作者和企业用户，显著提升语音内容制作效率。 VoiceCanvas

AiMakeSong

AiMakeSong 是基于人工智能的音乐和歌曲生成平台，支持用户通过简单的文本输入或歌词创作来生成高质量的音乐作品。用户可以选择将文字描述转化为音乐，或者将自己创作的歌词转化为完整的歌曲。平台提供了多种音乐风格和声音选项，包括流行、摇滚、说唱、古典等，以及男性、女性或乐器声音，满足不同用户的需求。 AiMakeSong的主要功能文本转音乐：用户可以通过描述自己的音乐想法，将这些想法

LLIA

LLIA（Low-Latency Interactive Avatars）是美团公司推出的基于扩散模型的实时音频驱动肖像视频生成框架。框架基于音频输入驱动虚拟形象的生成，支持实现低延迟、高保真度的实时交互。LLIA用可变长度视频生成技术，减少初始视频生成的延迟，结合一致性模型训练策略和模型量化技术，显著提升推理速度。LLIA支持用类别标签控制虚拟形象的状态（如说话、倾听、空闲）及面部表情的精细控制

LeVo

LeVo是腾讯AI实验室推出的AI唱歌模型，具备强大的音色克隆能力，仅需3秒音频即可精准复制目标音色，包括音调、情感和韵律，无需大量训练数据。LeVo支持分轨生成，可分别生成人声和伴奏音轨，为后期编辑提供便利。技术架构基于语言模型（LM），结合LeLM和音乐编解码器，能并行生成音轨，音质表现接近行业领先水平，在歌词对齐能力上表现卓越。 LeVo的项目地址项目官网： https://lev

DubbingX

智声云配（DubbingX）是 AI 智能配音工具，提供语音合成（TTS）、音色迁移、歌声转换等多种功能。工具支持中文、英文、日文、粤语等多语言，拥有近2500种情绪语态，支持高度定制，满足游戏、影视、动漫、有声书等多场景需求。工具音色版权合规，支持商用，能显著降低配音成本。智声云配结合专业高校和全球配音演员资源，致力于为用户提供高质量、多样化的音频解决方案。智声云配官网：https://d

AudioGenie

AudioGenie是腾讯AI Lab团队推出的多模态音频生成工具，能从视频、文本、图像等多种模态输入生成音效、语音、音乐等多种音频输出。工具采用无训练的多智能体框架，通过生成团队和监督团队的双层架构实现高效协同。生成团队负责将复杂的输入分解为具体的音频子事件，通过自适应混合专家（MoE）协作机制动态选择最适合的模型进行生成。监督团队则负责时空一致性验证，通过反馈循环进行自我纠错，确保生成的音频高

搜索结果