语音转录模型
最近开源大模型Kimi k2占据首位;Voxtral Small作为声音模型在huggingface上表现突出。它能够进行长格式转录和理解,支持多种语言,并能直接通过语音调用功能。此外,Voxtral还提供了两种版本:24B变体用于生产规模应用,3B变体适用于本地和边缘部署。
最近开源大模型Kimi k2占据首位;Voxtral Small作为声音模型在huggingface上表现突出。它能够进行长格式转录和理解,支持多种语言,并能直接通过语音调用功能。此外,Voxtral还提供了两种版本:24B变体用于生产规模应用,3B变体适用于本地和边缘部署。