9.2k星星!基于AI模型的开源视频字幕工具,字级时间戳准确度超剪映。


给视频加字幕、翻译字幕,之前这类开源也给大家推荐过,今天找到一个更好一些的。


像是给视频加字幕,这个剪映也能干,但是说实话,准确率还是差了点,而且剪映现在也涨价了,38块钱一个月了。


翻译字幕剪映干不了,自己要是一条一条的去翻译真会把人搞崩溃。


今天给大家推荐的VideoCaptioner,各方面做得都还不错,时间戳(保证字幕跟视频对齐)、字幕校正这些有了很大的优化。


扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)


项目简介


VideoCaptioner 是一个基于多模态大模型的视频字幕生成工具。它能够自动解析视频内容,提取画面与语音信息,并生成精准、流畅的中文或英文字幕。项目支持多种视频格式,结合大语言模型的强大理解能力,不仅能识别场景和对话,还能输出自然语言描述,提升视频的可读性与可传播性。适合自媒体创作者、教学视频制作人以及需要快速生成字幕的用户使用。


DEMO


页面预览

功能演示


· whisper转录



· 转录后的字幕



· 进行断句与字幕的优化翻译



· 合成的视频



功能特点


  • 语音识别:支持本地 Whisper/FasterWhisper 与在线接口,无需高配亦可生成精准字幕。 

  • VAD 静音切分与人声分离:更干净的语音轨道,提升识别准确率。

  • 字级时间戳:提供更精细的时间对齐,便于校对与二次编辑。

  • LLM 智能断句/校正:根据上下文优化断句与术语格式,使字幕更自然可读。

  • 字幕翻译:支持传统引擎与 LLM 方案,一键生成多语字幕。

  • 批量处理:支持批量生成与合成字幕,提升工作流效率。

  • 多线程优化:加速字幕生成、翻译与合成流程。 

  • 可视化编辑与预览:内置直观的字幕编辑界面,所见即所得预览。

  • 一键全流程:从识别、断句、优化、翻译到视频成片一站式处理。


项目链接


https://github.com/WEIFENG2333/VideoCaptioner


 关注「开源AI项目落地」公众号

(文:开源AI项目落地)

发表评论