语音理解生成归档

首个全面梳理语音大模型发展脉络的权威综述，入选ACL 2025主会

2025年6月17日16时作者机器之心

本文介绍了一篇被ACL 2025主会议接收的语音语言模型综述论文，该文由香港中文大学团队撰写。文章探讨了当前语音大模型的发展及其在自然对话、实时交互等方面的应用前景，并提出了未来研究的重点和挑战。

2025年3月28日19时作者 AI音频时代

阿里巴巴发布Qwen2.5-Omni-7B多模态AI模型，支持文本、图像、音频和视频等多种数据形式，并在手机和平板等终端设备上高效运行，推动AI技术普及。