huggingface发布了3B参数里的SoTA模型 smollm3

huggingface发布了3B参数里的SoTA模型 smollm3。支持 think / no_think 模式,默认不支持汉语。后续还会发布 SmolLM3 及其工程蓝图。它包含架构细节、精确的数据混合,展示了我们如何通过三阶段预训练方法逐步提升跨领域性能,以及构建混合推理模型的方法。

参考文献:
[1] https://huggingface.co/blog/smollm3



知识星球:Dify源码剖析及答疑,Dify扩展系统源码,AI书籍课程|AI报告论文,公众号付费资料。加微信buxingtianxia21进NLP工程化资料群,以及Dify交流群。

(文:NLP工程化)

发表评论