推理能力飙升,指令遵循暴跌?MathIF基准揭示大模型“服从性漏洞” 下午4时 2025/06/09 作者 PaperWeekly 研究揭示越擅长数学推理的模型反而更难完全遵守指令。这项发现强调了AI在处理复杂任务时的’聪明’与’听话’之间的权衡关系,未来有望构建既能深入思考又能严格守规矩的大模型。