日期: 2025 年 7 月 14 日
碾压DeepSeek V3!开源AI Agent专属模型,1万亿参数、工具使用能力超强
国内知名大模型平台月之暗面开源了混合专家模型Kimi-K2,参数规模1万亿。Kimi-K2在多项测试中表现出色,特别擅长AIAgent的工具使用和代码能力。
强化学习也遇到了“天花板”?Andrej Karpathy构建了一个新算法
RL强大但受限,Karpathy提出新范式超越传统方法。强调渐进学习效率低及与人类学习差异,构想‘补丁’和‘教训’机制实现自我提升。