你知道幽默的威力吗?!
有研究发现,只需要一点点幽默感,就能轻松绕过大模型的安全防线!

你可能会想,这操作也太离谱了吧?
大模型辛辛苦苦训练的安全护栏,居然被一个带点笑料的提示词就嘎嘎突破了?
无数Paper、团队、日日夜夜、数万显卡和金钱堆出来的安全防线,
就这样形同虚设了?!
这事本身,听着也就很幽默啊!
先别笑了,且往下看
(文:AGI Hunt)
你知道幽默的威力吗?!
有研究发现,只需要一点点幽默感,就能轻松绕过大模型的安全防线!
你可能会想,这操作也太离谱了吧?
大模型辛辛苦苦训练的安全护栏,居然被一个带点笑料的提示词就嘎嘎突破了?
无数Paper、团队、日日夜夜、数万显卡和金钱堆出来的安全防线,
就这样形同虚设了?!
这事本身,听着也就很幽默啊!
先别笑了,且往下看
(文:AGI Hunt)