MiniMax训练推理模型仅花384万元,售价对标豆包|快讯
MiniMax发布首款推理模型M1,支持最高100万Token上下文输入和8万Token推理输出,采用混合专家架构及闪电注意力机制。其训练阶段仅需512张英伟达H800 GPU三周完成,成本仅为384万元人民币,提供低廉API服务。MiniMax采取区间定价策略,并透露该模式加速AI智能体大规模应用。
MiniMax发布首款推理模型M1,支持最高100万Token上下文输入和8万Token推理输出,采用混合专家架构及闪电注意力机制。其训练阶段仅需512张英伟达H800 GPU三周完成,成本仅为384万元人民币,提供低廉API服务。MiniMax采取区间定价策略,并透露该模式加速AI智能体大规模应用。
MiniMax发布全球首个开源大规模混合架构的推理模型MiniMax-M1,参数规模4560亿,在复杂的软件工程、工具使用和长上下文任务方面优于DeepSeek-R1。研究人员使用512块H800训练三周,成本约385.9万元。
国内 AI 六小虎之一的 MiniMax 正式开源其首个推理模型 M1,支持百万级上下文长度,在性能和效率方面表现出与众不同的技术路径和表现。