Stable Audio Open Small 开源,为手机实现音频生成部署
Stability AI与Arm联合发布了一种名为Stable Audio Open Small的小型文本到音频模型,能够在智能手机上运行并实现约7秒生成11秒立体声音频的效果。该模型基于ARC技术开发,参数量减少至3.41亿,内存使用量降至3.6GB,适合移动设备使用。
Stability AI与Arm联合发布了一种名为Stable Audio Open Small的小型文本到音频模型,能够在智能手机上运行并实现约7秒生成11秒立体声音频的效果。该模型基于ARC技术开发,参数量减少至3.41亿,内存使用量降至3.6GB,适合移动设备使用。
Stability AI发布名为Stable Audio Open Small的音频生成AI模型,声称其为市场上速度最快的且能在智能手机上运行。该模型基于Free Music Archive和Freesound中的歌曲训练,并由Arm优化,支持英文提示输入和短音频样本生成。但仅限免费使用年收入低于100万美元的研究人员、爱好者和企业,年收入超过的需购买企业许可证。