关键词 "multilingual TTS" 的搜索结果, 共 24 条, 只显示前 480 条
PolyAI offers customer-led voice assistants to businesses, enabling consistent brand experience and data-driven opportunities.
Create AudioBooks or MP3 files from PDFs and eBooks.
Create voiceovers and videos with AI
Undetectable AI humanizer for authentic content creation.
Claude,美国人工智能初创公司Anthropic发布的大型语言模型家族,拥有高级推理、视觉分析、代码生成、多语言处理、多模态等能力,该模型对标ChatGPT、Gemini等产品。 2023年3月15日,Anthropic正式发布Claude的最初版本,并开始不断升级迭代;同年7月,Claude 2正式发布;同年11月,Claude 2.1正式发布;次年3月4日,Claude 3系列正式发布。
AI tool for transforming text into human-like content
LanguageTool is a free grammar checker and paraphraser for multiple languages.
AI chatbot builder for instant customer responses
This is an intelligent skin assistant that analyzes skin issues, provides suggestions, and supports image uploads and multilingual Q&A.
1分钟语音数据也可以用来训练一个好的TTS模型!(少量声音克隆).零样本 TTS:输入 5 秒的声音样本并体验即时文本到语音的转换。 Github上超过4万个星星
A TTS model capable of generating ultra-realistic dialogue in one pass.能够一次性生成超逼真对话的 TTS 模型。 Dia可以直接从文字记录生成高度逼真的对话。您可以根据音频调整输出,从而控制情绪和语调。该模型还可以生成非语言交流,例如笑声、咳嗽声、清嗓子等。 为了加速研究,我们提供预训练模型检查点和推理代码的访问权限。模型
ChatTS专注于对时间序列的理解和推理,类似于视觉/视频/音频 MLLM 的功能。此 repo 提供了以下代码、数据集和模型ChatTS:ChatTS:通过合成数据将时间序列与 LLM 对齐,以增强理解和推理。 ChatTS原生支持任意长度和值范围的多变量时间序列数据。借助ChatTS,您可以轻松理解和推理时间序列中的 形状特征和值ChatTS特征。此外,它还可以集成到现有的 LLM 流程
FunAudioLLM/CosyVoice(https://github.com/FunAudioLLM/CosyVoice) 项目是一个开源的多语言语音生成模型,它支持推理、训练和部署全流程。 该模型包括 CosyVoice-300M、CosyVoice-300M-SFT 和 CosyVoice-300M-Instruct 三种预训练模型,以及 CosyVoice-ttsfrd 资源。用户
"暴躁教授读论文"是一个学术论文阅读伴侣应用程序,旨在通过富有个性的AI助手提高论文阅读效率。它集成了PDF处理、AI翻译、RAG检索、AI问答和语音交互等多种功能,为学术研究者提供一站式的论文阅读解决方案。 主要特性 论文自动处理:导入PDF后自动提取、翻译和结构化论文内容 双语显示:支持中英文对照阅读论文 AI智能问答:与论文内容结合,提供专业的解释和分析 个性化AI教授:AI以"暴
MCP Server wrapper for TTS engines (Kokoro TTS and OpenAI TTS)
a MCP server enable your AI code editor (e.g., Cursor, Cline) with voice capabilities and voice response summaries
An MCP server for text-to-speech synthesis (TTS) for LLMs.
A TTS server based on MCP
TTS MCP Server
MCP Markdownify Server with UTF-8 Support - Enhanced version with better multilingual handling
MCP Server Tool for Text To Speech
MCP server that allows Claude to have a voice.
Production-grade ModelContextProtocol (MCP) server for the Smallest AI Waves platform. Exposes all Waves TTS and voice cloning features as MCP tools and resources. Ready for deployment.
Users can easily generate high-quality images and customize unique 3D character models with just a few inputs. The platform supports multilingual input and is ideal for various use cases such as illus
只显示前20页数据,更多请搜索
Showing 361 to 384 of 399 results