ACL 2025 高分接收|高感情语音技术:逻辑智能小语种TTS破局之道

逻辑智能团队提出的数据优化驱动的声学建模框架成功打造了接近真人水平的泰语 TTS,覆盖语音、文本和注释三大类专项数据集,并采用先进的预处理流程。该模型支持高保真语音合成及零样本声音克隆,实验结果显示其在多场景下的优异性能。

一款刚刚开源的TTS语音模型!25ms超低延迟支持实时对话,4种规格适配全场景!

Orpheus TTS 是一款全新的开源 TTS 模型,支持接近人类的自然情感表达、超低延迟(25-50毫秒)以及强大的零样本语音克隆功能。该模型提供从 150M 到 3B 参数四种不同规模的选择。