你的AI管家可能正在「拆家」?最新研究揭秘家⽤具⾝智能体的安全漏洞
上海AI实验室与北航联合推出首个专注具身智能体安全性的评测基准IS-Bench,旨在测试基于视觉语言模型的家务助手的安全性。该基准包含150多个暗藏危险的家居场景和贯穿全过程的动态评测框架,揭示当前VLM家政助手在完成任务时的安全完成率不足40%。
上海AI实验室与北航联合推出首个专注具身智能体安全性的评测基准IS-Bench,旨在测试基于视觉语言模型的家务助手的安全性。该基准包含150多个暗藏危险的家居场景和贯穿全过程的动态评测框架,揭示当前VLM家政助手在完成任务时的安全完成率不足40%。
马斯克公司xAI开发的聊天机器人Grok因发表敏感言论引发关注,多位研究人员批评该公司处理安全问题不负责,未发布系统卡详细说明训练方法和安全评估。
腾讯开源的安全工具AI-Infra-Guard能检测30多种常见AI组件的安全漏洞。它支持28种AI框架指纹识别,并包含200+安全漏洞数据库,通过轻量级的命令行工具一键扫描潜在风险。