语音转文字(STT)常需云端处理或复杂软件安装,隐私和便利性难以兼得。
Say 是一款基于Whisper和Transformers.js的开源浏览器内语音转文字工具,完全本地运行,保护隐私,同时提供实时转录和富文本编辑。

其核心特点包括:
-
• 浏览器本地运行:基于 Web Audio + Whisper 模型,实时转录,不依赖云端。 -
• 高精度转录:distil-whisper支持多语言,英语/中文准确率>90%。 -
• 实时波形显示:音频可视化,同步展示录音进度。 -
• 富文本编辑:内置Markdown编辑器,支持格式化、导出。 -
• 本地存储:笔记保存于IndexedDB,数据不外泄。 -
• 流畅UI:直观界面,零学习成本,拖拽录音秒用。
快速入手
方式一:在线使用,访问 Demo 页面即可使用。只需要点击“Start Recording”即可打开电脑麦克风进行录音,进而转为文字。

DEMO地址:https://say.addy.ie/
方式二:本地部署(开发者友好)
① 克隆项目
git clone https://github.com/addyosmani/say.git
cd say
② 安装依赖
npm install
③ 启动开发服务
npm run dev
最后,在浏览器打开 http://localhost:5173
,就能开始语音转写!
适用场景
-
• 会议记录:实时转录会议,富文本整理,效率翻倍。 -
• 个人笔记:语音日记/灵感记录,本地存储安全。 -
• 学习辅助:课堂/讲座转录,波形对齐重点。 -
• 隐私敏感:医疗/法律记录,数据不上传。
写在最后
日常工作中要想快速记录语音,传统的STT工具要么需要上传文件到云端让人担心隐私,要么需要借助专业软件安装又很麻烦。
而 Say 让语音笔记简单到飞起,所有音频和识别过程均在本地完成,最大限度保护隐私,录音过程中边录边转,适合即时记录场景。
如果你经常有语音记录的需求、注重数据私密性,又不想安装软件,那 Say 就是为你定制的隐私友好型语音笔记神器。
GitHub 项目地址:https://github.com/addyosmani/say

● 一款改变你视频下载体验的神器:MediaGo
● 字节把 Coze 核心开源了!可视化工作流引擎 FlowGram 上线,AI 赋能可视化流程!
● 英伟达开源语音识别模型!0.6B 参数登顶 ASR 榜单,1 秒转录 60 分钟音频!
● 开发者的文档收割机来了!这个开源工具让你一小时干完一周的活!
● PDF文档解剖术!OCR神器+1,这个开源工具把复杂排版秒变结构化数据!

(文:开源星探)