
给视频加字幕、翻译字幕,之前这类开源也给大家推荐过,今天找到一个更好一些的。
像是给视频加字幕,这个剪映也能干,但是说实话,准确率还是差了点,而且剪映现在也涨价了,38块钱一个月了。
翻译字幕剪映干不了,自己要是一条一条的去翻译真会把人搞崩溃。
今天给大家推荐的VideoCaptioner,各方面做得都还不错,时间戳(保证字幕跟视频对齐)、字幕校正这些有了很大的优化。
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)

项目简介
VideoCaptioner 是一个基于多模态大模型的视频字幕生成工具。它能够自动解析视频内容,提取画面与语音信息,并生成精准、流畅的中文或英文字幕。项目支持多种视频格式,结合大语言模型的强大理解能力,不仅能识别场景和对话,还能输出自然语言描述,提升视频的可读性与可传播性。适合自媒体创作者、教学视频制作人以及需要快速生成字幕的用户使用。
DEMO
页面预览


功能演示
· whisper转录

· 转录后的字幕

· 进行断句与字幕的优化翻译

· 合成的视频

功能特点
-
语音识别:支持本地 Whisper/FasterWhisper 与在线接口,无需高配亦可生成精准字幕。
-
VAD 静音切分与人声分离:更干净的语音轨道,提升识别准确率。
-
字级时间戳:提供更精细的时间对齐,便于校对与二次编辑。
-
LLM 智能断句/校正:根据上下文优化断句与术语格式,使字幕更自然可读。
-
字幕翻译:支持传统引擎与 LLM 方案,一键生成多语字幕。
-
批量处理:支持批量生成与合成字幕,提升工作流效率。
-
多线程优化:加速字幕生成、翻译与合成流程。
-
可视化编辑与预览:内置直观的字幕编辑界面,所见即所得预览。
-
一键全流程:从识别、断句、优化、翻译到视频成片一站式处理。
项目链接
https://github.com/WEIFENG2333/VideoCaptioner
关注「开源AI项目落地」公众号
(文:开源AI项目落地)