推理速度飙升5倍,苹果提出全新Multi-Token生成框架! 2025年7月24日14时 作者 PaperAgent Apple提出了一种新框架MTP,利用自回归语言模型的先验知识一次性预测多个后续词元,显著提高推理速度和并行能力。