MiniMax押注线性注意力让长文本训练速度基本不变 2025年4月17日8时 作者 NLP工程化 MiniMax-01通过线性注意力实现了4560亿参数的高效模型,克服了softmax瓶颈,并在多个关键技术上取得进展。