kyutai_labs把它的TTS开源了:Kyutai TTS
kyutai_labs发布TTS开源项目Kyutai TTS,支持文本流式传输和低延迟处理,可同时处理32个请求,英语和法语WER分别为2.82和3.29,目前支持英语和法语长文章。
kyutai_labs发布TTS开源项目Kyutai TTS,支持文本流式传输和低延迟处理,可同时处理32个请求,英语和法语WER分别为2.82和3.29,目前支持英语和法语长文章。
Kyutai TTS 是一款基于Delayed Streams Modeling(DSM)框架的实时文本转语音(TTS)模型,支持流式文本输入、超低延迟和高保真语音生成。参数量为1.6B,英语/法语WER分别为2.82%和3.29%,语音相似度为77.1%/78.7%。
Grok-4的基准测试数据在网上疯传,HLE成绩达到35%,使用推理后更是飙升到45%,相当于直接翻了一倍多,引发热议。
宇树科技在2025年上半年频繁动作引发市场关注,计划于科创板或港交所IPO。公司已完成多项融资,估值达120-150亿元,产品涵盖人形机器人、机器狗和灵巧手,已实现商业化落地并取得一定市场份额。
这项目能在4小时内贡献1800颗星,横轴为小时。Glass是一款轻量级桌面AI助手,支持实时会议记录、总结和知识转化等功能。
SAP首席执行官柯睿安认为欧洲不需要大量建立数据中心来竞争人工智能技术,因为大语言模型正在快速‘商品化’。他指出,训练这些模型需要大量能源和算力,但如今这些能力可以通过较少资源实现。