视频剪辑往往耗时费力,尤其在处理长视频或批量内容时,传统工具难以满足快速定位和智能剪辑的需求。
AI驱动视频剪辑的兴起,给视频剪辑带来了更加高效的剪辑方式。
PreenCut 是一款开源的AI驱动视频剪辑工具,基于WhisperX实现高精度语音转录,再结合DeepSeek和豆包API提供语义化搜索和智能剪辑功能。

提供有可视化操作界面,支持自动转录、智能分段、自然语言查询、批量处理、片段导出等核心功能,适合本地部署。
可通过自然语言描述快速定位视频片段,自动生成内容摘要并导出剪辑,极大提升效率。
核心功能
-
• 自动语音转录:基于WhisperX,提供高精度语音转文字,支持多语言和说话人区分。 -
• AI智能分段:AI智能分析视频内容,自动分段视频并生成每段内容摘要,捕捉关键信息。 -
• 自然语言搜索:通过描述性文字快速定位目标片段。 -
• 智能剪辑导出:支持单片段或多片段合并导出,生成高质量MP4文件。 -
• 批量处理:一次性分析多个视频,适合大规模内容处理。 -
• 提供重新分析选项:无需重复处理音频,换提示词即可重搜。
安装与部署
要想在本地部署该工具,需要有Python环境,还需要准备好DeepSeek和豆包的API密钥。
安装步骤如下:
① 克隆项目
git clone https://github.com/roothch/PreenCut.git
cd PreenCut
② 安装依赖项
pip install -r requirements.txt
③ 安装FFmpeg工具(音视频处理)
# ubuntu/Debian
sudo apt install ffmpeg
# CentOS/RHEL
sudo yum install ffmpeg
# macOS (using Homebrew)
brew install ffmpeg
# Windows: Download from https://ffmpeg.org/
④ 在config.py的LLM_MODEL_OPTIONS中设置LLM服务,并设置为环境变量。
# for example, if you are using DeepSeek and DouBao as LLM services
export DEEPSEEK_V3_API_KEY=your_deepseek_api_key
export DOUBAO_1_5_PRO_API_KEY=your_doubao_api_key
使用方式步骤:
① 启动 Gradio 界面,执行下面命令开启服务
python main.py
然后本地浏览器访问 http://localhost:7860
,即可打开网页界面。
② 上传视频/音频文件
支持的格式:mp4, avi, mov, mkv, ts, mxf, mp3, wav, flac
③ 配置选项
选择 LLM 模型,选择Whisper模型大小(微型 → 大型-v3),添加自定义分析提示(可选)。
④ 点击“开始处理”以分析内容
在分析表中可查看结果:开始/结束时间戳、持续时间、内容摘要、AI生成的标签。
⑤ 其他操作
可使用“重新分析”标签来尝试不同的提示。
也可使用“剪切”标签选择片段并选择导出模式:导出为ZIP包/合并成一个视频文件。
适用场景
-
• 长视频精剪:将访谈、讲座、播客等冗长内容,快速拆解成可用片段。 -
• 教育内容整理:将课程视频转换成章节总结,自动分段,提升内容利用率。 -
• 影视后期制作:批量处理镜头素材,提取指定场景,简化剪辑流程。 -
• 记者采访:语义搜索“某人发言”,快速生成新闻素材。 -
• 内容监控:监测直播、录播素材中的关键敏感片段。
写在最后
PreenCut 本质上是一个 AI 语义化视频编辑平台,核心价值在于:“把剪辑的核心问题(内容理解)交给 AI 处理,只保留最终选择权给人。”
提供可视化 Web 界面,非命令行用户也能轻松上手,同时支持文件拖拽上传、分段预览、快速跳转等功能。
相比传统剪辑工具,它让剪辑从时间线操作进化为语义操作,极大提升了效率与体验,特别适合内容密集型行业或 AI 辅助创作场景。
GitHub 项目地址:https://github.com/roothch/PreenCut

● 一款改变你视频下载体验的神器:MediaGo
● 字节把 Coze 核心开源了!可视化工作流引擎 FlowGram 上线,AI 赋能可视化流程!
● 英伟达开源语音识别模型!0.6B 参数登顶 ASR 榜单,1 秒转录 60 分钟音频!
● 开发者的文档收割机来了!这个开源工具让你一小时干完一周的活!
● PDF文档解剖术!OCR神器+1,这个开源工具把复杂排版秒变结构化数据!

(文:开源星探)