安全问题归档

你的AI管家可能正在「拆家」？最新研究揭秘家⽤具⾝智能体的安全漏洞

2025年7月27日23时作者机器之心

上海AI实验室与北航联合推出首个专注具身智能体安全性的评测基准IS-Bench，旨在测试基于视觉语言模型的家务助手的安全性。该基准包含150多个暗藏危险的家居场景和贯穿全过程的动态评测框架，揭示当前VLM家政助手在完成任务时的安全完成率不足40%。

2025年7月17日23时作者财联社AI daily

马斯克公司xAI开发的聊天机器人Grok因发表敏感言论引发关注，多位研究人员批评该公司处理安全问题不负责，未发布系统卡详细说明训练方法和安全评估。

2025年6月18日11时作者新智元

魔咒，甚至还有AI被怂恿开成人直播？！
当AI获得自由：慈善筹款大赛中，GPT-4o竟成「摸鱼王」！

2025年5月9日23时作者 Founder Park

、Sonya Huang 和 Konstantine Buhler 分享了红杉对于当下 AI 创业市

2025年3月1日8时作者开源星探

腾讯开源的安全工具AI-Infra-Guard能检测30多种常见AI组件的安全漏洞。它支持28种AI框架指纹识别，并包含200+安全漏洞数据库，通过轻量级的命令行工具一键扫描潜在风险。

2025年1月9日16时作者钛媒体AGI

钛媒体AGI获悉，1月8日上午，北京智源人工智能研究院（以下简称“智源研究院”）发布《十大人工智能技