通过 AI 自动分析视频内容并生成文字转录,其中语义化搜索功能颇有用,支持自然语言描述快速找到想要的视频片段。 GitHub:http://github.com/roothch/PreenCut…
主要功能: - 基于 WhisperX 的自动语音识别,生成准确的视频转录 - AI 智能分析,自动分段并总结每段内容要点 - 自然语言查询,用描述性文字快速找到目标片段 - 智能剪辑导出,可选择单个片段或合并成完整视频 - 批量处理功能,一次性分析多个视频文件 - 重新分析选项,无需重复处理音频即可尝试不同提示词 通过本地部署安装,支持配置 DeepSeek 和 豆包 的 API 密钥使用,提供了直观的可视化操作界面。
- 自动语音识别:由 WhisperX 提供支持,可实现准确转录
- 人工智能分析:使用大型语言模型来细分和总结内容
- 自然语言查询:使用描述性提示(例如“查找所有产品演示片段”)查找剪辑
- 智能剪辑:选择片段并将其导出为单独的文件或合并的视频
- 批处理:在多个文件中查找特定主题
- 重新分析:无需重新处理音频即可尝试不同的提示
- 克隆存储库:
git clone https://github.com/roothch/PreenCut.git
cd PreenCut
- 安装依赖项:
pip install -r requirements.txt
- 安装 FFmpeg(视频处理所需):
# ubuntu/Debian
sudo apt install ffmpeg
# CentOS/RHEL
sudo yum install ffmpeg
# macOS (using Homebrew)
brew install ffmpeg
# Windows: Download from https://ffmpeg.org/
- 设置 API 密钥(用于 LLM 服务):首先,您需要在 的 LLM_MODEL_OPTIONS 中设置您的 llm 服务
config.py
。然后将您的 API 密钥设置为环境变量:
# for example, if you are using DeepSeek and DouBao as LLM services
export DEEPSEEK_V3_API_KEY=your_deepseek_api_key
export DOUBAO_1_5_PRO_API_KEY=your_doubao_api_key