5.5米竹竿能否通过4×3米的门?几乎所有推理模型都答错了
文章报道了12款AI推理模型对能否通过高4米、宽3米门的竹竿问题的回答情况,最终只有Grok3和Qwen答对,展示了不同模型在三维空间思维上的差异。
文章报道了12款AI推理模型对能否通过高4米、宽3米门的竹竿问题的回答情况,最终只有Grok3和Qwen答对,展示了不同模型在三维空间思维上的差异。
Kimi开源Moonlight-16B模型,参数量16B,激活3B,性能优于LLAMA、Qwen和Deepseek-v2-Lite,在英文和中文能力上表现优异。
AI研究者Kimi发布了首个大规模混合专家模型Moonlight-16B-A3B,其使用Muon优化器在5.7T tokens的训练中实现了约2倍的计算效率提升,并开源了分布式Muon实现版本和预训练模型。
月之暗面Kimi因DeepSeek热潮暂缓‘烧钱’投放。近期大模型六小虎中有五家公司减少或暂停广告投放。月之暗面对推广动作进行相应调整,并推出新模型Kimi Latest,聚焦长文本输入与上下文长度控制。
理模型)异常火爆,Kimi 和 DeepSeek 陆续推出自家的产品 K1.5 和 R1,效果追评甚