开源TTS语音新标杆!Kyutai TTS:350ms延迟碾压全场,词级时间戳重构!

Kyutai TTS 是一款基于Delayed Streams Modeling(DSM)框架的实时文本转语音(TTS)模型,支持流式文本输入、超低延迟和高保真语音生成。参数量为1.6B,英语/法语WER分别为2.82%和3.29%,语音相似度为77.1%/78.7%。

万事俱备不缺东风,宇树科技站在科创板与港交所门口

宇树科技在2025年上半年频繁动作引发市场关注,计划于科创板或港交所IPO。公司已完成多项融资,估值达120-150亿元,产品涵盖人形机器人、机器狗和灵巧手,已实现商业化落地并取得一定市场份额。