NAB 2025 回顾:AI 与音频的结合成为可能

在2025年的NAB展会上,众多参展商展示了人工智能(AI)在音频制作、内容创作和媒体工作流程中的创新应用。包括Telos Alliance的AI驱动音频自动化平台、AI-Media的实时语音翻译解决方案LEXI Voice、Lawo的智能音频和混音引擎SAME、RTS与AudioShake的音频分离技术,以及Deepdub Live的实时多语言配音服务等。

AI音频最新发展:Anything万物生成音频

香港科技大学开发的 AudioX 机器学习模型能够根据用户的个性化输入生成独一无二的音频和音乐作品,包括文本、视频、图像等多模态数据,具有强大的跨模态学习能力,并能处理复杂的音频生成任务如音乐补全、修复等。

AI 声音分析让平原游隼在30 年后首次被发现

一种名为平原游禽的小型鸟类多年未见于墨尔本西部,但通过人工智能技术识别其叫声,终于被重新发现。维多利亚动物园安装了音频记录设备来监测当地鸟类的鸣叫,并成功锁定平原游禽的位置。

Krisp宣布推出AI工具,帮助人们听起来像美国人

Krisp推出AI口音转换功能,可在200毫秒内将用户印度口音转换为美式英语,提高沟通效率。目前支持17种印度方言,并计划扩展至其他地区。该功能已在企业环境中测试,提升销售转化率和每本书收入。但引发文化认同减弱及潜在欺诈风险的担忧。