AI音频时代

Mistral 首个开源 AI 音频模型“Voxtral”

2025年7月21日19时作者 AI音频时代

法国人工智能初创公司 Mistral 推出了开源音频模型 Voxtral，旨在为B2B市场提供价格实惠且功能强大的语音智能解决方案，支持多语言，并在性能上与OpenAI竞争对手相当，但成本更低。

2025年7月19日14时作者 AI音频时代

Audio Modeling 的 Stefano Lucato 在信中探讨了 AI 时代音乐创作的两种未来：一是机器生成作品；二是创作者与物理建模乐器互动。后者更强调表达性和互动性，让音乐家能够通过乐器表达自己。公司已对 SWAM 引擎进行改进，并启动公共测试计划，以期让用户提前体验这一未来。

2025年7月18日19时作者 AI音频时代

AI 音频分轨器利用 AI 技术从完整音频文件中分离人声、鼓、贝斯等元素，简化音乐制作流程。它支持多种应用场景，包括音乐制作、视频编辑和游戏音效。

2025年7月17日19时作者 AI音频时代

谷歌推出 Gemini 平台的新功能：将静态照片转化为带有生成式人工智能音频的短视频片段。利用 Veo 3 视频模型实现逼真动画效果，并提供背景音效、环境音效，甚至人物对话。

2025年7月16日14时作者 AI音频时代

Deepgram 推出 Saga 语音操作系统，让开发人员能通过语音直接控制技术堆栈，减少工具间的切换，提升生产力。

2025年7月15日19时作者 AI音频时代

微软下调Azure AI生成式人工智能技术价格60%，帮助用户更好地理解和分析多媒体内容，包括视频、文本、语音和图像等内容的提取与理解功能。

2025年7月14日19时作者 AI音频时代

顶尖制作人Lex Luger的声音现在可以通过AI模型在Lemonaide的Seeds应用中一键获取，该模型精准捕捉了Luger的音乐灵魂。

2025年7月12日14时作者 AI音频时代

全球领先的 AI 音频技术公司 Gaudio Lab发布移动端应用 Gaudio Studio，提供便捷的专业音频处理功能，支持音乐人、视频剪辑师等用户。

2025年7月11日19时作者 AI音频时代

Meta在剑桥开设1600万美元音频研究实验室，旨在推动AI眼镜音频发展，增强用户体验。

2025年7月10日19时作者 AI音频时代

Songscription是一家新的AI初创公司，其目标是帮助音乐家们通过自动将音频文件和YouTube链接转录成乐谱来提高生产力。它采用免费增值模式，并提供了虚拟钢琴卷来可视化正在演奏的内容。

较早文章

较新文章