OmniAudio:阿里通义实验室如何用360°视频开启空间音频新纪元?
Omniaudio 是阿里巴巴通义实验室推出的一种从 360° 视频生成空间音频的技术,通过自监督预训练和有监督微调提升性能。它能够直接生成 FOA 音频,并在虚拟现实和沉浸式娱乐中提供真实的 3D 音效体验。
Omniaudio 是阿里巴巴通义实验室推出的一种从 360° 视频生成空间音频的技术,通过自监督预训练和有监督微调提升性能。它能够直接生成 FOA 音频,并在虚拟现实和沉浸式娱乐中提供真实的 3D 音效体验。
Nokia与坦佩雷大学合作开发了一种新的基于深度神经网络(DNN)的环境声编码方法,能够自动适应不同的麦克风阵列排列,并在保持高质量音频处理的同时显著降低开发成本。
苹果正在开发集成摄像头的AirPods,预计2026年发布。这些摄像头用于红外传感器和空中手势控制,提升空间音频体验,并有可能扩展到AR和VR领域。