关键词 "直播" 的搜索结果, 共 10 条, 只显示前 480 条
BILIVE 是基于 AI 技术的开源工具,专为 B 站直播录制与处理设计。工具支持自动录制直播、渲染弹幕和字幕,支持语音识别、自动切片精彩片段,生成有趣的标题和风格化的视频封面。BILIVE 能自动将处理后的视频投稿至 B 站,综合多种模态模型,兼容超低配置机器,无需 GPU 即可运行,适合个人用户和小型服务器使用。 1. Introduction Have you notice
蝉镜是营销数据分析平台蝉妈妈旗下推出的一款AI数字人短视频与直播平台,通过极速克隆技术和高效的内容生产流程,使用户能够快速创建并发布数字人短视频。用户只需上传简短视频和文案,即可生成具有个性化数字人形象的视频内容。蝉镜平台还提供了智慧直播功能,支持7*24小时不间断的直播互动,适配多种场景和模板,大幅降低了视频制作和直播的门槛,为电商和内容创作者提供了新的营销和表达手段。 蝉镜的主要功能
有言是由魔珐科技推出的一个一站式AIGC视频创作和3D数字人生成平台,通过提供海量超写实3D虚拟人角色,帮助用户无需真人出镜即可制作视频。该平台基于魔珐自研的AIGC技术,支持用户输入文字快速生成3D内容,并提供自定义编辑、字幕、动效、背景音乐等后期包装功能,简化视频制作流程,让创作变得高效而有趣。 有言的主要功能 一站式服务:有言整合了从内容生成到后期制作的全套流程,为用户提供了从开始到
如影数字人超级直播间,行业首创多模态智能运营,依托“商汤日日新SenseNova”多模态大模型,具备智能选品、素材提炼等能力,能够大幅提高直播间运营效率。无需视频采集即可复刻现有直播间,当日复刻当日播。 支持多平台直播,智能互动逼真形象引流吸粉
PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主持人、嘉宾和编剧)自动生成丰富且结构化的对话内容。PodAgent构建了多样化的声音库,用在精准匹配角色与声音,确保音频的自然度和沉浸感。PodAgent 引入基于大语言模型(LLM)的语音合成技术,生成富有表现力和情感的语音,让播客更具吸引力。PodAgent 推出了全面的评
MoonCast 是零样本播客生成系统,从纯文本源合成自然的播客风格语音。通过长上下文语言模型和大规模语音数据训练,能生成几分钟长的播客音频,支持中文和英文。生成语音的自然性和连贯性,在长音频生成中能保持高质量。MoonCast 使用特定的LLM提示来生成播客脚本,通过语音合成模块将其转换为最终的播客音频。用户可以通过简单的命令和预训练权重快速生成播客。 MoonCast的项目地址 项目官
OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于超过200万小时的音频数据训练,支持13种语言。采用双自回归(Dual-AR)架构和强化学习与人类反馈(RLHF)技术,生成的声音高度自然、流畅,几乎与人类配音无异。模型支持超过50种情感和语调标记,用户可通过自然语言指令灵活调整语音表达。OpenAudio S1支持零样本和少样本语音克隆,仅需10到30秒的音频样本
Hautech.AI 是基于AI技术生成逼真时尚模特照片的工具。Hautech.AI 支持将简单的平面产品图像快速转换为高质量的模特展示图,具有高度的定制化功能,用户根据需求选择模特的年龄、性别、外貌特征、姿势和背景等。Hautech.AI助力品牌节省传统拍摄的时间和成本,提升内容的多样性和吸引力,广泛应用在社交媒体、产品目录、广告制作等场景,帮助时尚品牌高效地生成视觉内容,增强市场竞争力。 H
MNN轻量级高性能推理引擎 通用性 - 支持TensorFlow、Caffe、ONNX等主流模型格式,支持CNN、RNN、GAN等常用网络。 高性能 - 极致优化算子性能,全面支持CPU、GPU、NPU,充分发挥设备算力。 易用性 - 转换、可视化、调试工具齐全,能方便地部署到移动设备和各种嵌入式设备中。 什么是 TaoAvatar?它是阿里最新研究
在 HermitAI,我们的使命是让人工智能更加个性化、更实用、更易于访问。我们相信,人工智能应该适应你,而不是你适应人工智能。 我们的平台将尖端语言模型与检索增强生成 (RAG) 技术相结合,以创建了解您的特定需求和知识库的 AI 助手。
只显示前20页数据,更多请搜索