MiniMax-M1:全球首个开源权重的大规模混合注意力推理模型,专为处理长输入和复杂任务而生,特别是在数学 reasoning、编码、软件工程、工具使用和长文本理解方面。亮点:1. 支持100万token的上下文长度,是DeepSeek R1的8倍;2. 在10万token生成长度下,计算效率比DeepSeek R1高75%;3. 在复杂软件工程和长文本任务中表现卓越,超越Qwen3-235B和DeepSeek-R1。


参考文献:
[1] http://github.com/MiniMax-AI/MiniMax-M1
[2] https://www.minimax.io/
知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。
(文:NLP工程化)