Mistral 发了个小模型—— Magistral-Small-2506 这是他们的首个推理模型

Mistral 刚又发了个小模型—— Magistral-Small-2506 这是他们的首个推理模型。这是个  Mistral Small 3.1 微调的版本,增加了推理能力的疯狂RL版本。这个大小很适合单卡 32G 跑。至于分数跟 Qwen3-4B 差不多。GPQA 会高一些。但AIME甚至没有Qewn3-4B 高。

参考文献:
[1] 模型地址:https://huggingface.co/mistralai/Magistral-Small-2506 

[2] Unsloth 量化版本地址:https://huggingface.co/unsloth/Magistral-Small-2506-GGUF


知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群

(文:NLP工程化)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往