强化学习与人类反馈归档

Fish Audio 的 OpenAudio S1：新一代语音生成，让机器也能“声临其境”！

2025年6月17日14时作者小兵的AI视界

OpenAudio S1 是 Fish Audio 推出的多语言 TTS 模型，基于超过200万小时的音频数据训练，采用双自回归架构和强化学习与人类反馈技术。支持13种语言、40亿参数版本及5亿参数开源版，并具备零样本语音克隆功能。