Qwen3-SmVL:基于Qwen3和SmolVLM拼接打造1 GB显存可跑的中文超小多模态大模型 2025年8月3日14时 作者 小兵的AI视界 觉编码器,通过特征对齐 + 指令微调构建的中文超小多模态大模型, 可在 1 GB 显存设备完成推理,
SmolVLM2: 让视频理解能力触手可及 2025年3月22日14时 作者 Hugging Face 本性转变——从依赖海量计算资源的巨型模型,转向可在任何设备运行的轻量级模型。我们的目标很简单: 让视