Agentic-R1 推理新范式,融合多策略蒸馏,实现高效工具链长链推理 2025年7月20日8时 作者 NLP工程化 Agentic-R1 推出一种新的推理范式,通过双蒸馏技术整合多模型路径,显著提升复杂推理任务的性能,并提供完整的训练和测试资源。