关键词 "speech-to-text transcription" 的搜索结果, 共 9 条, 只显示前 480 条
Local MCP server for MLX Whisper transcription
A MCP server that provides audio transcription capabilities using OpenAI's Whisper API
A high-performance speech recognition MCP server based on Faster Whisper, providing efficient audio transcription capabilities.
An MCP server providing intelligent transcript processing capabilities, featuring natural formatting, contextual repair, and smart summarization powered by Deep Thinking LLMs.
Model Control Protocol (MCP) server for ElevenLabs Scribe ASR API
An MCP Server for audio transcription using OpenAI
极简部署AI视频翻译配音工具 KrillinAI-一款AI视频翻译配音工具 提供了从视频下载,音频提取,音频转录,文本切割,翻译,对齐,到最终合成适配抖音,哔哩哔哩,小红书,视频号,快手等主流平台格式的一站式解决方案。 基于AI大模型的视频翻译和配音工具,专业级翻译,一键部署全流程,可以生成适配抖音,小红书,哔哩哔哩,视频号,TikTok,Youtube Shorts等形态的
Unmute 是 Kyutai 推出的低延迟语音交互系统,专注于低延迟语音转文字(Speech-to-Text)和文字转语音(Text-to-Speech)。Unmute 基于先进的 AI 模型,为用户提供实时、高效的语音交互体验。用户基于语音与 AI 进行交流,支持将文字内容快速转换为自然流畅的语音输出。Unmute 的低延迟处理能力,能实现无缝的语音交互。 Unmute的主要功能
只显示前20页数据,更多请搜索
Showing 409 to 417 of 417 results