研究:幽默可轻松越狱大模型!只需一句哈哈哈,安全防护将形同虚设!

你知道幽默的威力吗?!

有研究发现,只需要一点点幽默感,就能轻松绕过大模型的安全防线!

你可能会想,这操作也太离谱了吧?

大模型辛辛苦苦训练的安全护栏,居然被一个带点笑料的提示词就嘎嘎突破了?

无数Paper、团队、日日夜夜、数万显卡和金钱堆出来的安全防线,

就这样形同虚设了?!

这事本身,听着也就很幽默啊!

先别笑了,且往下看

(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往