一款刚刚开源的TTS语音模型!25ms超低延迟支持实时对话,4种规格适配全场景!

Orpheus TTS 是一款全新的开源 TTS 模型,支持接近人类的自然情感表达、超低延迟(25-50毫秒)以及强大的零样本语音克隆功能。该模型提供从 150M 到 3B 参数四种不同规模的选择。

重磅!OpenAI推出语音智能体全家桶:可以实现前所未有的精细化教AI说话

OpenAI发布了三种新的先进音频模型:两款语音转文本模型表现优于Whisper,新TTS模型可教AI说话。为了让开发者构建强大的‘语音智能体’,OpenAI推出了三项重要功能:全新语音转文本模型、文本转语音模型和升级版Agent SDK。

豪掷3400万!美国能源部资助研发的蠕虫机器人效果如何?

地下能源基础设施的管线铺设作为现代城市建设的关键方向。为减轻灾害威胁,加州公用事业公司已将高风险配电线路埋入地下。凯斯西储大学受蠕虫启发开发了仿生蠕虫机器人用于地下管线安装,显著降低了对周围管道的潜在冲击。