你的AI管家可能正在「拆家」?最新研究揭秘家⽤具⾝智能体的安全漏洞

上海AI实验室与北航联合推出首个专注具身智能体安全性的评测基准IS-Bench,旨在测试基于视觉语言模型的家务助手的安全性。该基准包含150多个暗藏危险的家居场景和贯穿全过程的动态评测框架,揭示当前VLM家政助手在完成任务时的安全完成率不足40%。

全球首个通用科学智能体:SciMaster重新定义AI科研助手

人工智能与科学研究的深度融合正重塑科学发现边界。上海交通大学-深势科技联合发布的SciMaster作为全球首款通用科学智能体,通过并行化处理加速科研流程,并结合科学基座大模型Innovator优化信息理解和处理能力。