MiniMax-01 开源即精品:破解超长文本处理难题!

MiniMax-01系列模型开源,支持400W token长文本处理。该系列通过线性注意力机制大幅降低计算成本和提高效率。MiniMax-Text-01在文本任务与多模态任务上表现优异,展示了强大的超长文本理解和处理能力。

颠覆GPT!Meta推出大型概念模型LCM: 从“猜词”到“理解”

Meta FAIR 新发布的大型概念模型(LCM)打破了传统语言模型逐词预测的局限,它将句子视为一个概念单元,在句子表征空间中进行建模。LCM的核心组件是SONAR,支持超过200种语言和多模态输入。