推理导向训练归档

推理能力飙升，指令遵循暴跌？MathIF基准揭示大模型“服从性漏洞”

2025年6月9日16时作者 PaperWeekly

研究揭示越擅长数学推理的模型反而更难完全遵守指令。这项发现强调了AI在处理复杂任务时的’聪明’与’听话’之间的权衡关系，未来有望构建既能深入思考又能严格守规矩的大模型。