MiniMax押注线性注意力让长文本训练速度基本不变 上午8时 2025/04/17 作者 NLP工程化 MiniMax-01通过线性注意力实现了4560亿参数的高效模型,克服了softmax瓶颈,并在多个关键技术上取得进展。