音频质量归档 - 每时AI

阿里通义开源首个CoT音频模型，音·画同步被狠狠拿捏了

2025年7月1日16时作者量子位

，来快速感受一下最新feel：
模拟婴儿哭声，那叫一个高低起伏、荡气回肠，整个节奏和婴儿表情姿态神同

OCTAVE TTS：首个能理解说话内容的文本转语音模型

2025年3月8日8时作者 NLP工程化

OCTAVE TTS首个理解说话内容的文本转语音模型，音频质量、自然度超70%用户偏好，能生成多样化语音。