U-Net架构归档

开源端到端语音大模型：直接从原始音频输入，生成语音输出

2025年7月2日16时作者 AIGC开放社区

专注于大语言模型在多任务应用的研究及AIGC开发者生态建设。Step-Audio团队开源了端到端语音大模型Step-Audio-AQAA，能够直接生成自然流畅的音频回答。