CISPO算法
碾压DeepSeek推理4倍!MiniMax M1百万token长文屠榜,开源登顶全球前二
近日MiniMax开启#MiniMaxWeek技术周,发布全新M1模型。M1模型在训练与推理效率上显著提升,支持超长文本输入和输出(最大100万个token)。特别擅长Agent工具调用任务。核心技术包括混合注意力架构和CISPO算法。
MiniMax重磅开源M1模型:百万上下文超DeepSeek R1,实现性能与效率双杀
国内 AI 六小虎之一的 MiniMax 正式开源其首个推理模型 M1,支持百万级上下文长度,在性能和效率方面表现出与众不同的技术路径和表现。