百万小时训练!这个中文TTS模型让AI播客告别”机械音”,效果堪比真人主播 2025年7月14日14时 作者 小兵的AI视界 MOSS-TTSD 是由清华大学语音与语言实验室开发的开源口语对话语音生成模型,支持中文和英文双语生成,并具备零样本语音克隆能力,广泛应用于 AI 播客、访谈、新闻报道等多种场景。
邱锡鹏团队开源MOSS-TTSD!百万小时音频训练,突破AI播客恐怖谷 2025年7月5日23时 作者 机器之心 MOSS-TTSD 拥有革命性成果,基于百万小时音频训练的模型能生成高质量对话语音,包括多语言支持和超长语音合成能力。