一推理一编程,“AI六小龙”MiniMax、月之暗面同推开源模型

2025年初,’AI六小龙’几乎从舆论场中消失。MiniMax和月之暗面宣布开源新成果,并部署下一步路线。MiniMax-M1在软件工程、上下文处理等任务上表现出色,参数量达4560亿;Kimi-Dev-72B在编程基准测试中表现优异,参数量仅为72B。

MiniMax训练推理模型仅花384万元,售价对标豆包|快讯

MiniMax发布首款推理模型M1,支持最高100万Token上下文输入和8万Token推理输出,采用混合专家架构及闪电注意力机制。其训练阶段仅需512张英伟达H800 GPU三周完成,成本仅为384万元人民币,提供低廉API服务。MiniMax采取区间定价策略,并透露该模式加速AI智能体大规模应用。

MiniMax开源首个推理模型!456B参数,性能超DeepSeek-R1,技术报告公开

MiniMax发布全球首个开源大规模混合架构的推理模型MiniMax-M1,参数规模4560亿,在复杂的软件工程、工具使用和长上下文任务方面优于DeepSeek-R1。研究人员使用512块H800训练三周,成本约385.9万元。