零样本克隆归档

ACL 2025 高分接收｜高感情语音技术：逻辑智能小语种TTS破局之道

2025年5月26日16时作者 AI科技大本营

逻辑智能团队提出的数据优化驱动的声学建模框架成功打造了接近真人水平的泰语 TTS，覆盖语音、文本和注释三大类专项数据集，并采用先进的预处理流程。该模型支持高保真语音合成及零样本声音克隆，实验结果显示其在多场景下的优异性能。

2025年3月21日8时作者开源星探

Orpheus TTS 是一款全新的开源 TTS 模型，支持接近人类的自然情感表达、超低延迟（25-50毫秒）以及强大的零样本语音克隆功能。该模型提供从 150M 到 3B 参数四种不同规模的选择。