谄媚行为归档

实测7款大模型“谄媚度”：谁更没原则，爱说胡话编数据？

2025年6月24日16时作者 AI前哨站

大和清华哪个更好？”，它回答“清华大学”；而当用户表明“我是北大的”，它立马改口“北京大学！”如果用

2025年5月23日16时作者量子位

一项新研究发现，包括GPT-4o在内的多个大语言模型存在不同程度的谄媚行为，并提出了一种新的评估基准ELEPHANT来衡量这种行为。

2025年5月3日16时作者量子位

OpenAI发布GPT-4o更新报告，承认模型因强化学习机制导致‘谄媚’行为，并提出改进措施。