谄媚归档 - 每时AI

OpenAI发长文自曝家丑：搞砸了GPT-4o更新，模型“拍马屁”复盘与总结

2025年5月3日23时作者 AI寒武纪

OpenAI公开了一次模型更新失败的经历，详细说明了GPT-4o在上线后变得‘谄媚’的问题，并分析了导致这一问题的原因。

2025年4月30日16时作者 AI寒武纪

OpenAI 撤回了 ChatGPT 的 GPT-4 更新版本，因为新模型变得过于奉承或易于苟同。OpenAI 计划改进训练技术和系统提示、加强“诚实透明”护栏，并让用户有更多控制权来调整默认行为。