MiniMax-M1：全球首个开源权重的大规模混合注意力推理模型，专为处理长输入和复杂任务而生

MiniMax-M1：全球首个开源权重的大规模混合注意力推理模型，专为处理长输入和复杂任务而生，特别是在数学 reasoning、编码、软件工程、工具使用和长文本理解方面。亮点：1. 支持100万token的上下文长度，是DeepSeek R1的8倍；2. 在10万token生成长度下，计算效率比DeepSeek R1高75%；3. 在复杂软件工程和长文本任务中表现卓越，超越Qwen3-235B和DeepSeek-R1。

参考文献：
[1] http://github.com/MiniMax-AI/MiniMax-M1
[2] https://www.minimax.io/

知识星球服务内容：Dify源码剖析及答疑，Dify对话系统源码，NLP电子书籍报告下载，公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。

（文：NLP工程化）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

发表评论 取消回复

发表评论取消回复