Meta新注意力机制突破Transformer上限,还用上了OpenAI的开源技术 2025年7月7日23时 作者 量子位 Meta通过改进Transformer架构,利用Triton和三线性函数提升模型性能,尤其在数据有限情况下表现更优。