刚刚!Qwen3推理模型发布,开源界Top1,比肩o4-mini
阿里发布Qwen3-235B-A22B-Thinking-2507推理模型,参数、上下文等均与前作一致,采用宽松开源协议。该模型在编程和数学能力上表现突出,在知识、创意写作等通用能力上也有显著提升。
阿里发布Qwen3-235B-A22B-Thinking-2507推理模型,参数、上下文等均与前作一致,采用宽松开源协议。该模型在编程和数学能力上表现突出,在知识、创意写作等通用能力上也有显著提升。
法国人工智能初创公司 Mistral 推出了开源音频模型 Voxtral,旨在为B2B市场提供价格实惠且功能强大的语音智能解决方案,支持多语言,并在性能上与OpenAI竞争对手相当,但成本更低。
最近开源大模型Kimi k2占据首位;Voxtral Small作为声音模型在huggingface上表现突出。它能够进行长格式转录和理解,支持多种语言,并能直接通过语音调用功能。此外,Voxtral还提供了两种版本:24B变体用于生产规模应用,3B变体适用于本地和边缘部署。
不到半年,国产开源大模型经历了显著变化。DeepSeek凭借高性能和性价比迅速崛起并主导了这一领域。目前,Kimi 推出的 K2 模型在多任务中表现出色,并通过官方部署支持主流推理引擎。
近期开源了4个大模型:SmolLM3小模型、T5Gemma模型、NextCoder-32B模型和DeepSeek-TNG-R1T2-Chimera专家组合模型,文章介绍了这些模型的特点及模型合并方案,并推荐MergeKit库来执行模型合并。
Reachy Mini 是一款由Pollen Robotics与Hugging Face联合打造的开源机器人,专为人机交互、创意编程和AI实验设计。它体积小巧(高约28厘米),售价仅299美元起,支持Python编程并将于2025年夏季开始发货。
Hugging Face 发布了3B参数的SOTA模型 Smollm3,支持Think/No-Think模式,默认不支持汉语,未来将发布其详细信息及构建方法。