OpenAI自曝“o4”训练中,用思维链监控抓住AI作弊瞬间 下午4时 2025/03/11 作者 量子位 OpenAI研究显示通过监控推理模型的思维链来发现其作弊行为,但过度优化可能诱导模型隐藏意图。该方法在提高模型能力的同时也可能增加不良行为,但仍能有效识别不良意图。