
靠着一个快捷键,颠覆长达几十年的文字输入习惯。这就是AI语音输入应用Wispr Flow在做的事情。
今年,AI语音无疑成了硅谷最卷的赛道。Meta、OpenAI、Google 集体发力,而Wispr Flow却悄悄在这场竞赛中冲了出来。
就在不久前, Wispr Flow完成了3000万美元A轮融资,累计融资额达5600万美元。
公司CEO Tanay Kothari透露,硅谷几乎每一家一线风投机构内部都在用 Wispr Flow来处理邮件、写备忘、记录文档。
作为一款AI语音输入法,Wispr Flow的核心功能很直接:你说话,它转文字。相比传统转录软件,它最大的亮点在于两个字:丝滑。
用户体验有多丝滑?说两组数据大家就明白了:
用户下载Wispr Flow六个月后,仍有80%保持活跃使用。更重要的是,其中一半以上的用户,已经用它完成了超70%的文字输入。
这不仅是高粘性,更意味着——语音输入正在从“辅助工具”变成主力交互方式。
靠着超高的用户粘性,Wispr Flow取得了令人瞩目的商业化成绩。
截至目前,Wispr Flow 的付费转化率高达19%,远超大多数SaaS产品。与此同时,用户规模月环比增长高达50%,月收入环比增长60%,年收入已达380万美元。
今天,乌鸦君就带你来看看这一款AI语音键盘是怎么变成这么多人的心头好。
/ 01 /
大模型用说话代替打字,输入效率提升4倍
说服用户从键盘转向语音,不是容易的事,但Wispr Flow只用了一个快捷键,就做到了。
只需按住Fn键开始说话,松开后,你的语音内容就会自动出现在鼠标所在的输入框中,无需切换应用,几乎适用于所有软件。
据说,用Wispr Flow进行输入,会比手动打字快3-4倍。
能达到这么快,关键不在于转录功能,而在于准确识别和自动编辑。它对小语种、罕见字的识别不在话下,其涵盖了110+种语言。
更重要的是,它能直接交付你最终想要表达的文本。如果说话时间间隔长、中途改变了想法,它都可以自动修改,也支持语音指令改写文本。好比我们的一段漫谈,Wispr Flow也能将其转化为结构化的文本。
小说作家Jeannette Tan:“心流是你大脑中额外的一小部分,当你陷入思考时,它能帮助你形成完整的句子。”
当传统工具还在琢磨“单词错误率”时,Wispr Flow早已以“零编辑率”为产品革新的目标,他们想直接解决用户对最终文本可用性的需求。对于“零编辑率”,官方说法是“大于80%”,而用户反映实际体验接近100%。
为了更“懂你”,Wispr Flow对你苦心钻研。“不像你的前任,它确实从错误中吸取教训。”Wispr Flow在最新的广告里如此调侃。
它会自建属于你的“黑话字典”。它会消化你的行话或者俚语,并以“专属字典”来调整转录文字,结果就是连标点符号和断句都能符合你的原意。对于行业术语壁垒,它通过共享上下文和自定义术语API,来攻克这一点。用户还可按场景定制语气(邮件/文档等)。
Menlo Ventures CEO马特·克兰宁谈道:“Wispr Flow创建高效转化数字思维和意图的方式,精准捕捉用户语音和真实表达意图,其开发模型更关注自然说话方式。”
与竞品SuperWhisper/Aqua/Talktastic对标,Wispr Flow功能深度显著领先(自动编辑+语调调整+命令模式)。深扒其技术,主要靠两点完成突破:
-
意图驱动转录:深度定制模型,从专注理解用户意图,到生成结构化、符合语境的文本(如自动删填充词、修正语义错误、自动标点),大幅降低模型幻觉率,确保意图映射精准。
-
超低延迟&高兼容性:系统级集成(OS层运行),支持110+语言零延迟转录,跨平台兼容(Mac/Windows/iOS,Android 开发中)。
Wispr Flow的团队拥有顶级AI实验室背景,音频处理及消费者应用开发的积累深厚,并拥有端到端模型定制能力。联创Tanay Sethi和Sahaj Mehra均为资深技术开发者,前者曾任职埃隆马斯克的脑机接口公司,后者在Snapchat和Robinhood负责语音UI、移动基建等工程。
团队的下一步计划是向代理型AI演进,将应用拓展至提醒、上下文感知任务处理。他们也有意将Wispr Flow与硬件集成,或打造软硬一体生态,增强场景控制力。
/ 02 /
VC精英起手,形成自然裂变
在产品推广方面,Wispr Flow走了一条不同寻常的金字塔式渗透路线。
谁能像Wispr Flow一样,第一批用户就是VC/技术精英。硅谷VC和专业人士日常十分依赖该软件。Digits AI CEO Jeff Seibert用其完成70%董事会文档,Superhuman CEO Rahul Vohra称赞其为“ChatGPT后最佳AI产品”。
Wispr Flow为自己的产品找到了超高契合度的需求场景,并能让行业影响力背书,自然裂变效果极强。
这让我联想到国内有一个总结文档的小产品叫“会读”,它的增长策略也是通过VC、行业人士在微信朋友圈的社交传递,利用他们的影响力进行推广,这种方式在早期帮助产品迅速积累了目标用户。
接着,Wispr Flow通过Product Hunt(4.8/5分)和专业社区渗透技术人群。Reddit(r/macapps)网友AnConnor说:“早期我批评了他们很多,但现在我是他们最直言不讳的客户之一,它帮助我避免在某些任务上浪费时间。
这群人也有着爱学习、爱分享的特性,Wispr Flow在没有设计任何裂变奖励机制的情况下,他们仍然自发地分享。
去年6月,在大家都把模型层的事儿讨论完后,也开始关注能实际上手的AI产品,Wispr Flow作为技术力较为突出的产品也收获了一批关注。
对于更广泛的消费用户,Wispr Flow提供了免费套餐(每周2000字)和12美元/月付费套餐。如今,Wispr flow的全球用户,美国占40%,欧洲占30%。
通过“精英用户驱动+免费引流”策略,它构建高黏性口碑生态,推动语音输入从工具向工作基础设施跃迁。如今,Wispr Flow一半的新用户来自Reddit和X,这是由口碑和对产品质量的信任驱动的,产品变成了最好的渠道。
在此背后,是创始人IP与产品哲学的深度绑定。神童创始人Tanay Kothari拥有连续创业背景,12岁自学大学课程、13岁创建病毒式增长产品、IOI选手,在斯坦福大学求学期间创办并成功出售公司。
创业过程中,Kothari从默念输入设备这个失败的硬件项目,转向了软件交互界面Wispr Flow,应用的早期版本发布就受硅谷风投机构青睐,产生入站投资和口碑。
有意思的是,投资人还特别关注Wispr Flow对残障人士(例如 ADHD、腕管、帕金森氏症)用户的吸引力。NEA合伙人Andrew Schoen谈道:“Wispr Flow吸引了受多动症、腕管综合症、截肢和帕金森病影响的人群,帮助他们实现无缝沟通和创意表达。”
资本押注Wispr Flow背后,是语音界面将引发“从打字到说话的大迁移”的行业共识。
Wispr Flow被定位为工作场景的SaaS级入口,而大模型成熟(解决意图理解)和移动设备交互瓶颈(语音>触屏输入效率)都会成为支撑这一点的趋势。
文/朗朗
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。
(文:乌鸦智能说)