语音合成 - 梅斯AI导航站

Countless.dev

Compare and evaluate various AI models and their specifications.

Resemble

Generate synthetic voices that resemble real humans in seconds.

Voiser

Voiser is an AI program that converts text to speech and speech to text with human-like voices.

Texttovoice.online

Convert text to English voices online using AI power.

Rask AI

Rask AI provides top-quality AI video dubbing and localization with 130+ languages.

VidAU

Generate engaging videos in batches within a few minutes

TTSMaker

A free online text-to-speech tool with over 200 AI voices and support for multiple languages.

Text Reader AI

Free text-to-speech with lifelike AI voices.

FakeYou

Generate realistic and natural speech with FakeYou using deep fake technology.

Typecast AI

Typecast is an AI voice generator with 400+ realistic voices for creating lifelike audio content.

LOVO AI

AI语音生成器是什么 AI语音生成器是一种利用人工智能技术将文本转换为语音的工具Genny是LOVO AI开发的一款先进的AI语音生成器，它具备500+种声音和100种语言的支持，能够为视频、营销、培训、社交媒体等内容创作提供高质量的语音Genny的特点在于其超逼真的声音，几乎无法与真实人类的声音区分开来 AI语音生成器的主要功能和特点 Genny的主要功能和特点包括：超逼真的AI声音，支

Play.ht

PlayHT is an AI Voice Generator platform with over 600 voices in multiple languages.

Deepgram AI Voice Generator

AI voice generator and text-to-speech platform

Deepgram Voice AI

Real-time speech-to-text and text-to-speech APIs powered by Deepgram's voice AI models

Listnr AI

Create voiceovers and videos with AI

SpeechGen.io

Generate high-quality voiceovers with SpeechGen.io's realistic Text-to-Speech AI technology.

Voicemaker

Voicemaker® converts text to human-like voices, offering various voice profiles and customization options.

easycallcenter365

它是开源了从FreeSWITCH模块，语音合成，语音识别，到java版的电话工具条等，完整的源码都提供了。项目采用Apache2.0用户协议。主要功能如下： 1. 支持对接大模型 2. 支持实时流式语音合成 3. 支持acd话务排队 4. 支持AI通话无缝转接人工坐席 5. 支持电话工具条 6. 支持IMS视频通话/语音通话转视频 7. 支

暴躁的教授读论文（mad-professor）

"暴躁教授读论文"是一个学术论文阅读伴侣应用程序，旨在通过富有个性的AI助手提高论文阅读效率。它集成了PDF处理、AI翻译、RAG检索、AI问答和语音交互等多种功能，为学术研究者提供一站式的论文阅读解决方案。主要特性论文自动处理：导入PDF后自动提取、翻译和结构化论文内容双语显示：支持中英文对照阅读论文 AI智能问答：与论文内容结合，提供专业的解释和分析个性化AI教授：AI以"暴

Spark-TTS

<p>Overview Spark-TTS 是由出门问问（Mobvoi）联合多所顶尖学术机构（如香港科技大学、上海交通大学）最新推出的新一代语音合成模型，其核心创新在于BiCodec编码技术和与文本大模型的结构统一性，利用大型语言模型 (LLM) 的强大功能实现高度准确且自然的语音合成。</p> <p>Spark-TTS is an advanced text

Muyan-TTS

Muyan-TTS，一款低成本、具备良好二次开发支持的模型并完全开源，以方便学术界和小型应用团队的音频技术爱好者。当前开源的Muyan-TTS版本由于训练数据规模有限，致使其仅对英语语种呈现出良好的支持效果。不过，得益于与之同步开源的详尽训练方法，从事相关行业的开发者能够依据自身实际业务场景，灵活地对Muyan-TTS进行功能升级与定制化改造。 01. H

VoiceCanvas

VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务，支持超过 50 种语言，集成 OpenAI TTS、AWS Polly 和 MiniMax 等多种语音服务。VoiceCanvas 提供个人声音克隆功能，用户上传几秒音频样本能创建个性化声音。VoiceCanvas适合内容创作者、教育工作者和企业用户，显著提升语音内容制作效率。 VoiceCanvas

JoyPix

JoyPix 是专注于数字人和语音合成的AI创作工具。用户可以通过上传照片创建个性化的虚拟形象，支持与虚拟形象进行语音对话。JoyPix 提供自定义虚拟形象，可以根据自己的需求进一步定制虚拟形象的外观。JoyPix支持声音克隆，用户只需上传10秒音频片段，可克隆自己的声音，生成自然流畅的语音输出。JoyPix 的文本转语音功能可以将文本转换为逼真的语音，满足多种语音合成需求。JoyPix提供了虚拟

PodAgent

PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景，用多智能体协作系统（包括主持人、嘉宾和编剧）自动生成丰富且结构化的对话内容。PodAgent构建了多样化的声音库，用在精准匹配角色与声音，确保音频的自然度和沉浸感。PodAgent 引入基于大语言模型（LLM）的语音合成技术，生成富有表现力和情感的语音，让播客更具吸引力。PodAgent 推出了全面的评

搜索结果