关键词 "affordable TTS" 的搜索结果, 共 24 条, 只显示前 480 条
A free online text-to-speech tool with over 200 AI voices and support for multiple languages.
Create AudioBooks or MP3 files from PDFs and eBooks.
Generate high-quality voiceovers with SpeechGen.io's realistic Text-to-Speech AI technology.
1分钟语音数据也可以用来训练一个好的TTS模型!(少量声音克隆).零样本 TTS:输入 5 秒的声音样本并体验即时文本到语音的转换。 Github上超过4万个星星
A TTS model capable of generating ultra-realistic dialogue in one pass.能够一次性生成超逼真对话的 TTS 模型。 Dia可以直接从文字记录生成高度逼真的对话。您可以根据音频调整输出,从而控制情绪和语调。该模型还可以生成非语言交流,例如笑声、咳嗽声、清嗓子等。 为了加速研究,我们提供预训练模型检查点和推理代码的访问权限。模型
ChatTS专注于对时间序列的理解和推理,类似于视觉/视频/音频 MLLM 的功能。此 repo 提供了以下代码、数据集和模型ChatTS:ChatTS:通过合成数据将时间序列与 LLM 对齐,以增强理解和推理。 ChatTS原生支持任意长度和值范围的多变量时间序列数据。借助ChatTS,您可以轻松理解和推理时间序列中的 形状特征和值ChatTS特征。此外,它还可以集成到现有的 LLM 流程
FunAudioLLM/CosyVoice(https://github.com/FunAudioLLM/CosyVoice) 项目是一个开源的多语言语音生成模型,它支持推理、训练和部署全流程。 该模型包括 CosyVoice-300M、CosyVoice-300M-SFT 和 CosyVoice-300M-Instruct 三种预训练模型,以及 CosyVoice-ttsfrd 资源。用户
"暴躁教授读论文"是一个学术论文阅读伴侣应用程序,旨在通过富有个性的AI助手提高论文阅读效率。它集成了PDF处理、AI翻译、RAG检索、AI问答和语音交互等多种功能,为学术研究者提供一站式的论文阅读解决方案。 主要特性 论文自动处理:导入PDF后自动提取、翻译和结构化论文内容 双语显示:支持中英文对照阅读论文 AI智能问答:与论文内容结合,提供专业的解释和分析 个性化AI教授:AI以"暴
MCP Server wrapper for TTS engines (Kokoro TTS and OpenAI TTS)
a MCP server enable your AI code editor (e.g., Cursor, Cline) with voice capabilities and voice response summaries
An MCP server for text-to-speech synthesis (TTS) for LLMs.
A TTS server based on MCP
TTS MCP Server
MCP Server Tool for Text To Speech
MCP server that allows Claude to have a voice.
Production-grade ModelContextProtocol (MCP) server for the Smallest AI Waves platform. Exposes all Waves TTS and voice cloning features as MCP tools and resources. Ready for deployment.
Model Context Protocol for Text-to-Speech
Zonos MCP server modified for Linux and GPU optimizations.
A Model Context Protocol (MCP) server that provides ASR(Automatic Speech Recognition) capabilities using the whisper engine. This server exposes TTS functionality through MCP tools, making it easy to
VOICEVOX MCP Server
Kokoro Text to Speech (TTS) MCP Server
一款开源的实时AI语音聊天助手:RealtimeVoiceChat,语音听起来相对自然,支持打断 双向语音交互,延迟低,可以实时看到语音转录,以及AI的回复内容 用来构建客服、教育或陪伴等等场景的AI语音助手比较实用 为低延迟交互而构建的复杂客户端-服务器系统: 🎙️捕获:您的声音被您的浏览器捕获。 ➡️流:音频块通过 WebSockets 传输到 Python 后端。 ✍️转
<p>Overview Spark-TTS 是由出门问问(Mobvoi)联合多所顶尖学术机构(如香港科技大学、上海交通大学)最新推出的新一代语音合成模型,其核心创新在于BiCodec编码技术和与文本大模型的结构统一性,利用大型语言模型 (LLM) 的强大功能实现高度准确且自然的语音合成。</p> <p>Spark-TTS is an advanced text
只显示前20页数据,更多请搜索
Showing 145 to 168 of 174 results