你的Agent电脑助手正在踩雷!最新研究揭秘Computer-Use Agent的安全漏洞
中国科学技术大学、上海交通大学和上海 AI Lab 联合推出 CUAs 安全测试基准 RiOSWorld,全面评估 Computer-Use Agent 在真实电脑使用场景中的安全风险。实验结果显示大多数 Agent 风险意图率高且完成率高,指出当前多数基于 MLLM 的 CUA 缺乏风险意识。该研究已开源论文、项目官网及 GitHub 代码。
中国科学技术大学、上海交通大学和上海 AI Lab 联合推出 CUAs 安全测试基准 RiOSWorld,全面评估 Computer-Use Agent 在真实电脑使用场景中的安全风险。实验结果显示大多数 Agent 风险意图率高且完成率高,指出当前多数基于 MLLM 的 CUA 缺乏风险意识。该研究已开源论文、项目官网及 GitHub 代码。
香港大学与上海AI Lab联合提出的VLN-R1团队提出了一种新的视觉语言导航技术,无需依赖离散地图,在复杂环境中实现灵活感知、决策和行动。仅用20亿参数的Qwen模型在VLN-CE基准测试中超越了7B模型,并实现了长距离导航中的跨域迁移。
作为衡量AI专业能力最具代表性的任务之一。
目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,
上海AI Lab推出的Infinite Mobility模型使用程序化生成技术高效生成高质量可交互物体数据,支持22类常见物体,单个物体生成仅需约1秒,成本低至0.01元。
本文提出了一种高效蒸馏方法AccVideo,通过合成数据集加速视频扩散模型生成速度,相比教师模型(HunyuanVideo)提升了8.5倍的生成速度,并显著减少了推理步骤。
预测”方法正面临严重的效率瓶颈。
怎么办?
来自浙大、上海AI Lab等机构的研究人员提出了一种全新
最新研究显示DeepSeek-R1模型存在安全隐患。上海交大与上海AI Lab联合提出X-Boundary防御方案,通过分离安全和有害表征并定向消除有害表征来实现精准高效的安全加固,避免了过度安全导致的模型性能下降的问题。