9.2k星星！基于AI模型的开源视频字幕工具，字级时间戳准确度超剪映。

给视频加字幕、翻译字幕，之前这类开源也给大家推荐过，今天找到一个更好一些的。

像是给视频加字幕，这个剪映也能干，但是说实话，准确率还是差了点，而且剪映现在也涨价了，38块钱一个月了。

翻译字幕剪映干不了，自己要是一条一条的去翻译真会把人搞崩溃。

今天给大家推荐的VideoCaptioner，各方面做得都还不错，时间戳（保证字幕跟视频对齐）、字幕校正这些有了很大的优化。

扫码加入AI交流群

获得更多技术支持和交流

（请注明自己的职业）

项目简介

VideoCaptioner 是一个基于多模态大模型的视频字幕生成工具。它能够自动解析视频内容，提取画面与语音信息，并生成精准、流畅的中文或英文字幕。项目支持多种视频格式，结合大语言模型的强大理解能力，不仅能识别场景和对话，还能输出自然语言描述，提升视频的可读性与可传播性。适合自媒体创作者、教学视频制作人以及需要快速生成字幕的用户使用。

DEMO

页面预览

功能演示

· whisper转录

· 转录后的字幕

· 进行断句与字幕的优化翻译

· 合成的视频

功能特点

语音识别：支持本地 Whisper/FasterWhisper 与在线接口，无需高配亦可生成精准字幕。
VAD 静音切分与人声分离：更干净的语音轨道，提升识别准确率。
字级时间戳：提供更精细的时间对齐，便于校对与二次编辑。
LLM 智能断句/校正：根据上下文优化断句与术语格式，使字幕更自然可读。
字幕翻译：支持传统引擎与 LLM 方案，一键生成多语字幕。
批量处理：支持批量生成与合成字幕，提升工作流效率。
多线程优化：加速字幕生成、翻译与合成流程。
可视化编辑与预览：内置直观的字幕编辑界面，所见即所得预览。
一键全流程：从识别、断句、优化、翻译到视频成片一站式处理。

项目链接

https://github.com/WEIFENG2333/VideoCaptioner

关注「开源AI项目落地」公众号

（文：开源AI项目落地）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

发表评论 取消回复

发表评论取消回复