通杀主流LLM!用知识图谱“撬开”大模型安全门,黑盒越狱新范式HBS-KGLLM发布

南京航空航天大学团队提出HBS-KGLLM框架,通过增强知识图谱挖掘有害信息结构化知识,实现有效探测LLMs的安全性能。该方法成功率高、成本低,并已在多款主流模型上测试表现优异。