MathIF 归档 - 每时AI

AI越聪明越不听话！新研究：最强推理模型指令遵循率仅50%

2025年5月24日16时作者量子位

研究揭示大模型越擅长数学推理反而越难完全遵守用户指令，提出了MathIF基准来衡量AI的指令遵循能力。