关键词 "声音" 的搜索结果, 共 24 条, 只显示前 480 条
A free online text-to-speech tool with over 200 AI voices and support for multiple languages.
AI-powered mastering service
Generate realistic and natural speech with FakeYou using deep fake technology.
Empower Your Content with AI powered Voices.
Musicfy: Create AI voice clone, make music effortlessly.
Typecast is an AI voice generator with 400+ realistic voices for creating lifelike audio content.
AI语音生成器是什么 AI语音生成器是一种利用人工智能技术将文本转换为语音的工具Genny是LOVO AI开发的一款先进的AI语音生成器,它具备500+种声音和100种语言的支持,能够为视频、营销、培训、社交媒体等内容创作提供高质量的语音Genny的特点在于其超逼真的声音,几乎无法与真实人类的声音区分开来 AI语音生成器的主要功能和特点 Genny的主要功能和特点包括: 超逼真的AI声音,支
PlayHT is an AI Voice Generator platform with over 600 voices in multiple languages.
AI voice changer for online chats, gaming, and streaming.
Real-time AI voice changer with stunning effects.
Voicemaker® converts text to human-like voices, offering various voice profiles and customization options.
1分钟语音数据也可以用来训练一个好的TTS模型!(少量声音克隆).零样本 TTS:输入 5 秒的声音样本并体验即时文本到语音的转换。 Github上超过4万个星星
Kimi-Audio,这是一个开源音频基础模型,在音频理解、生成和对话方面表现出色。此存储库包含 Kimi-Audio 的官方实现、模型和评估工具包。 通用功能:处理语音识别(ASR)、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分类(SEC/ASC)和端到端语音对话等多种任务。 最先进的性能:在众多音频基准测试中取得 SOTA 结果(参见评估和技术报告)。
FunAudioLLM/CosyVoice(https://github.com/FunAudioLLM/CosyVoice) 项目是一个开源的多语言语音生成模型,它支持推理、训练和部署全流程。 该模型包括 CosyVoice-300M、CosyVoice-300M-SFT 和 CosyVoice-300M-Instruct 三种预训练模型,以及 CosyVoice-ttsfrd 资源。用户
Retell AI 正在利用快速、智能且适应性强的 AI 语音助手,重新定义企业与客户互动的方式。与其他公司不同,我们的尖端技术可帮助企业实现自动化通话,同时又不失人性化。 我们的目标正在改变企业与客户的沟通方式。我们预见未来,AI 助手对话将打破壁垒,使支持更便捷、互动更顺畅、企业响应速度比以往任何时候都更快。 在 Retell AI,我们不仅致力于实现通话自动化,更致力于构建一个让每个
AigcPanel 是一个简单易用的一站式AI数字人系统,支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。
一款开源的实时AI语音聊天助手:RealtimeVoiceChat,语音听起来相对自然,支持打断 双向语音交互,延迟低,可以实时看到语音转录,以及AI的回复内容 用来构建客服、教育或陪伴等等场景的AI语音助手比较实用 为低延迟交互而构建的复杂客户端-服务器系统: 🎙️捕获:您的声音被您的浏览器捕获。 ➡️流:音频块通过 WebSockets 传输到 Python 后端。 ✍️转
<p>Overview Spark-TTS 是由出门问问(Mobvoi)联合多所顶尖学术机构(如香港科技大学、上海交通大学)最新推出的新一代语音合成模型,其核心创新在于BiCodec编码技术和与文本大模型的结构统一性,利用大型语言模型 (LLM) 的强大功能实现高度准确且自然的语音合成。</p> <p>Spark-TTS is an advanced text
从聊天记录创建数字分身的一站式解决方案 使用微聊天信记录变量大语言模型,让大模型有“那味儿”,并绑定到聊天机器人,实现自己的数字分身。 数字克隆/数字分身/数字永生/声音克隆/LLM/大语言模型/微信聊天机器人/LoRA
Muyan-TTS,一款低成本、具备良好二次开发支持的模型并完全开源,以方便学术界和小型应用团队的音频技术爱好者。 当前开源的Muyan-TTS版本由于训练数据规模有限,致使其仅对英语语种呈现出良好的支持效果。不过,得益于与之同步开源的详尽训练方法,从事相关行业的开发者能够依据自身实际业务场景,灵活地对Muyan-TTS进行功能升级与定制化改造。 01. H
Addsubtitle 是基于 AI 的在线视频编辑工具,通过智能技术为用户提供便捷的字幕添加、翻译及视频编辑服务。用户可以轻松将视频翻译成100多种语言,一键添加多种语言的字幕,提升视频的全球覆盖率。直观的在线编辑器支持实时编辑字幕文本,能自定义字幕样式,包括字体、颜色、尺寸和布局等,满足不同品牌和风格的需求。 Addsubtitle的主要功能 AI 视频翻译:支持将视频翻译成100
VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI TTS、AWS Polly 和 MiniMax 等多种语音服务。VoiceCanvas 提供个人声音克隆功能,用户上传几秒音频样本能创建个性化声音。VoiceCanvas适合内容创作者、教育工作者和企业用户,显著提升语音内容制作效率。 VoiceCanvas
蝉镜是营销数据分析平台蝉妈妈旗下推出的一款AI数字人短视频与直播平台,通过极速克隆技术和高效的内容生产流程,使用户能够快速创建并发布数字人短视频。用户只需上传简短视频和文案,即可生成具有个性化数字人形象的视频内容。蝉镜平台还提供了智慧直播功能,支持7*24小时不间断的直播互动,适配多种场景和模板,大幅降低了视频制作和直播的门槛,为电商和内容创作者提供了新的营销和表达手段。 蝉镜的主要功能
JoyPix 是专注于数字人和语音合成的AI创作工具。用户可以通过上传照片创建个性化的虚拟形象,支持与虚拟形象进行语音对话。JoyPix 提供自定义虚拟形象,可以根据自己的需求进一步定制虚拟形象的外观。JoyPix支持声音克隆,用户只需上传10秒音频片段,可克隆自己的声音,生成自然流畅的语音输出。JoyPix 的文本转语音功能可以将文本转换为逼真的语音,满足多种语音合成需求。JoyPix提供了虚拟
只显示前20页数据,更多请搜索
Showing 97 to 120 of 135 results