DeepSeek R2没来,Kimi K2来了,VLLM,SGLang首发支持

杨植麟提出开源路线,Moonshot AI发布Kimi K2大语言模型,采用混合专家架构,参数量达1万亿,表现出色并在多个基准测试中创造新SOTA记录。核心技术包括MuonClip优化器、大规模Agent数据合成和通用强化学习框架。模型提供两种版本,并通过修改版MIT协议开源。

深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?

Kimi 月之暗面发布了开源大模型 Kimi K2,价格16元人民币/百万 token 输出。K2 在多个基准测试中表现优异,并引入了 MuonClip 优化器和大规模合成数据策略等创新技术。

刚刚,月之暗面投下王炸:万亿参数Kimi K2开源,世界最强Agent模型来了?

月之暗面发布Kimi K2模型,拥有1万亿总参数和320亿激活参数的混合专家(MoE)模型。该模型在编码、数学及工具使用方面达到头部大模型水平,并支持指令微调以供聊天和智能体应用。其训练过程采用MuonClip优化器解决大规模预训练中的注意力问题,通过虚拟世界模拟数据提升Agent能力。