Kimi新模型数学反超DeepSeek!北大校友刘征瀛等领衔
Kimi新模型在定理证明任务上超越了DeepSeek,采用TTRL搜索框架和错误修复机制,通过率显著提高。该模型由Numina组织与Kimi团队联合打造,并计划在未来优化引理的筛选策略。
Kimi新模型在定理证明任务上超越了DeepSeek,采用TTRL搜索框架和错误修复机制,通过率显著提高。该模型由Numina组织与Kimi团队联合打造,并计划在未来优化引理的筛选策略。
Kimi团队发布开源的Kimi-VL和Kimi-VL-Thinking多模态模型,参数量分别为28亿激活参数和2.8B。模型在多个基准测试中表现出色,并采用MoE架构提高效率。
Kimi团队发布开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,参数为16B但推理时仅激活2.8B。具备强大的多模态推理能力和Agent能力。支持128K上下文窗口,采用宽松的MIT许可证。
Kimi 和 DeepSeek 通过 RL 技术分别在 short-CoT 和 long-CoT 模式下取得了出色表现,并提出了一些关键技术,如 Partial rollouts 来提升训练效率和长 CoT 数据涌现机制。该领域的发展显示了 AI 在复杂任务中的潜在能力。