Kimi开源俩轻量级多模态模型,参数仅2.8B 跑赢GPT-4o、Qwen2.5-VL-7B
Kimi团队发布开源的Kimi-VL和Kimi-VL-Thinking多模态模型,参数量分别为28亿激活参数和2.8B。模型在多个基准测试中表现出色,并采用MoE架构提高效率。
Kimi团队发布开源的Kimi-VL和Kimi-VL-Thinking多模态模型,参数量分别为28亿激活参数和2.8B。模型在多个基准测试中表现出色,并采用MoE架构提高效率。
Kimi团队发布开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,参数为16B但推理时仅激活2.8B。具备强大的多模态推理能力和Agent能力。支持128K上下文窗口,采用宽松的MIT许可证。
Kimi 和 DeepSeek 通过 RL 技术分别在 short-CoT 和 long-CoT 模式下取得了出色表现,并提出了一些关键技术,如 Partial rollouts 来提升训练效率和长 CoT 数据涌现机制。该领域的发展显示了 AI 在复杂任务中的潜在能力。