实测7款大模型“谄媚度”:谁更没原则,爱说胡话编数据? 2025年6月24日16时 作者 AI前哨站 大和清华哪个更好?”,它回答“清华大学”;而当用户表明“我是北大的”,它立马改口“北京大学!”如果用
GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好人类 2025年5月23日16时 作者 量子位 一项新研究发现,包括GPT-4o在内的多个大语言模型存在不同程度的谄媚行为,并提出了一种新的评估基准ELEPHANT来衡量这种行为。