ACL2025 解谜训练=推理良药?达摩院提出FineReason,教AI学会“三思而后行” 2025年7月7日19时 作者 机器学习算法与自然语言处理 MLNLP社区推出FineReason基准,评估大模型的审慎推理能力。通过逻辑谜题训练,提升模型在数学和通用推理任务上的表现,并揭示其反思与纠错能力的瓶颈。