社区供稿 | MiniMax-01 开源: 新架构开启 Agent 时代
近日,MiniMax 发布了全新系列模型MiniMax-01,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型参数量高达4560亿,可以高效处理全球最长的400万token上下文,并实现了线性注意力机制,性能接近GPT-4。
近日,MiniMax 发布了全新系列模型MiniMax-01,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型参数量高达4560亿,可以高效处理全球最长的400万token上下文,并实现了线性注意力机制,性能接近GPT-4。
MiniMax团队发布了MiniMax-Text-01开源大模型,拥有456B参数量、100万训练上下文长度及400万推理上下文长度。该模型在多项基准测试中表现优异,并提供了开放下载的模型权重、完整的在线体验空间和商业使用许可。