语音转录模型

最近开源大模型Kimi k2占据首位;Voxtral Small作为声音模型在huggingface上表现突出。它能够进行长格式转录和理解,支持多种语言,并能直接通过语音调用功能。此外,Voxtral还提供了两种版本:24B变体用于生产规模应用,3B变体适用于本地和边缘部署。

AI“压力面”,DeepSeek性能暴跌近30% 清华&上海AI Lab

给大模型来一场‘压力测试’,研究团队设计REST框架,在一个多任务并行推理场景中发现顶级模型的表现大幅缩水。通过上下文预算分配、跨问题干扰抵抗和动态认知负载管理等能力评估,揭示了当前评测方法的局限性,并提出了新的评测数据构建范式。