开源语音转文字神器!浏览器本地运行,无需上传,Whisper驱动,隐私+实时两不误!

 

语音转文字(STT)常需云端处理或复杂软件安装,隐私和便利性难以兼得。

Say 是一款基于Whisper和Transformers.js的开源浏览器内语音转文字工具,完全本地运行,保护隐私,同时提供实时转录和富文本编辑。

其核心特点包括:

  • • 浏览器本地运行:基于 Web Audio + Whisper 模型,实时转录,不依赖云端。
  • • 高精度转录:distil-whisper支持多语言,英语/中文准确率>90%。
  • • 实时波形显示:音频可视化,同步展示录音进度。
  • • 富文本编辑:内置Markdown编辑器,支持格式化、导出。
  • • 本地存储:笔记保存于IndexedDB,数据不外泄。
  • • 流畅UI:直观界面,零学习成本,拖拽录音秒用。

快速入手

方式一:在线使用,访问 Demo 页面即可使用。只需要点击“Start Recording”即可打开电脑麦克风进行录音,进而转为文字。

DEMO地址:https://say.addy.ie/

方式二:本地部署(开发者友好)

① 克隆项目

git clone https://github.com/addyosmani/say.git
cd say

② 安装依赖

npm install

③ 启动开发服务

npm run dev

最后,在浏览器打开 http://localhost:5173,就能开始语音转写!

适用场景

  • • 会议记录:实时转录会议,富文本整理,效率翻倍。
  • • 个人笔记:语音日记/灵感记录,本地存储安全。
  • • 学习辅助:课堂/讲座转录,波形对齐重点。
  • • 隐私敏感:医疗/法律记录,数据不上传。

写在最后

日常工作中要想快速记录语音,传统的STT工具要么需要上传文件到云端让人担心隐私,要么需要借助专业软件安装又很麻烦。

而 Say 让语音笔记简单到飞起,所有音频和识别过程均在本地完成,最大限度保护隐私,录音过程中边录边转,适合即时记录场景。

如果你经常有语音记录的需求、注重数据私密性,又不想安装软件,那 Say 就是为你定制的隐私友好型语音笔记神器。

GitHub 项目地址:https://github.com/addyosmani/say

 

● 一款改变你视频下载体验的神器:MediaGo

● 字节把 Coze 核心开源了!可视化工作流引擎 FlowGram 上线,AI 赋能可视化流程!

● 英伟达开源语音识别模型!0.6B 参数登顶 ASR 榜单,1 秒转录 60 分钟音频!

● 开发者的文档收割机来了!这个开源工具让你一小时干完一周的活!

● PDF文档解剖术!OCR神器+1,这个开源工具把复杂排版秒变结构化数据!








(文:开源星探)

发表评论