在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架 2025年3月12日12时 作者 机器之心 线被拉升,以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。 随之