数学编码超越O3-high,英伟达版「DeepSeek R1二代」推理模型开源~ 2025年7月22日14时 作者 PaperAgent Nvidia开源OpenReasoning-Nemotron系列模型,采用Qwen2.5架构训练,表现卓越,在多项推理基准测试中刷新最先进水平,支持‘heavy’模式多智能体协作。