AI音频最新发展:Anything万物生成音频

香港科技大学开发的 AudioX 机器学习模型能够根据用户的个性化输入生成独一无二的音频和音乐作品,包括文本、视频、图像等多模态数据,具有强大的跨模态学习能力,并能处理复杂的音频生成任务如音乐补全、修复等。

AI 声音分析让平原游隼在30 年后首次被发现

一种名为平原游禽的小型鸟类多年未见于墨尔本西部,但通过人工智能技术识别其叫声,终于被重新发现。维多利亚动物园安装了音频记录设备来监测当地鸟类的鸣叫,并成功锁定平原游禽的位置。

Krisp宣布推出AI工具,帮助人们听起来像美国人

Krisp推出AI口音转换功能,可在200毫秒内将用户印度口音转换为美式英语,提高沟通效率。目前支持17种印度方言,并计划扩展至其他地区。该功能已在企业环境中测试,提升销售转化率和每本书收入。但引发文化认同减弱及潜在欺诈风险的担忧。