Mistral 首个开源 AI 音频模型“Voxtral”
法国人工智能初创公司 Mistral 推出了开源音频模型 Voxtral,旨在为B2B市场提供价格实惠且功能强大的语音智能解决方案,支持多语言,并在性能上与OpenAI竞争对手相当,但成本更低。
法国人工智能初创公司 Mistral 推出了开源音频模型 Voxtral,旨在为B2B市场提供价格实惠且功能强大的语音智能解决方案,支持多语言,并在性能上与OpenAI竞争对手相当,但成本更低。
Audio Modeling 的 Stefano Lucato 在信中探讨了 AI 时代音乐创作的两种未来:一是机器生成作品;二是创作者与物理建模乐器互动。后者更强调表达性和互动性,让音乐家能够通过乐器表达自己。公司已对 SWAM 引擎进行改进,并启动公共测试计划,以期让用户提前体验这一未来。
AI 音频分轨器利用 AI 技术从完整音频文件中分离人声、鼓、贝斯等元素,简化音乐制作流程。它支持多种应用场景,包括音乐制作、视频编辑和游戏音效。
谷歌推出 Gemini 平台的新功能:将静态照片转化为带有生成式人工智能音频的短视频片段。利用 Veo 3 视频模型实现逼真动画效果,并提供背景音效、环境音效,甚至人物对话。
微软下调Azure AI生成式人工智能技术价格60%,帮助用户更好地理解和分析多媒体内容,包括视频、文本、语音和图像等内容的提取与理解功能。
顶尖制作人Lex Luger的声音现在可以通过AI模型在Lemonaide的Seeds应用中一键获取,该模型精准捕捉了Luger的音乐灵魂。
全球领先的 AI 音频技术公司 Gaudio Lab发布移动端应用 Gaudio Studio,提供便捷的专业音频处理功能,支持音乐人、视频剪辑师等用户。
Songscription是一家新的AI初创公司,其目标是帮助音乐家们通过自动将音频文件和YouTube链接转录成乐谱来提高生产力。它采用免费增值模式,并提供了虚拟钢琴卷来可视化正在演奏的内容。