「AI黑客」来袭,Agentic AI如何成为新守护者?

机器之心报道

机器之心编辑部

以 AI 之矛,攻 AI 之盾。


AI 崛起:技术双刃剑下的安全暗战 


随着 AI 技术的快速发展,网络安全面临的威胁日益复杂化,攻击手段不仅更高效、隐蔽,还催生了新型的「AI 黑客」形态,因此引发了各类新型网络安全危机。


首先是生成式 AI 正重塑网络诈骗的「精准度」。 


简单而言,就是将传统的钓鱼攻击智能化,比如在更精准的场景中,攻击者会利用公开社交数据训练 AI 模型,批量生成个性化钓鱼邮件,模仿特定用户的写作风格或语言习惯,实施「定制化」诈骗,绕过传统垃圾邮件过滤器,大幅提升攻击成功率。 


接着是最为大众所熟知的深度伪造(Deepfake)与身份冒用。在 AI 技术成熟之前,传统的「变脸诈骗攻击」,即 BEC 诈骗,全称为「Business Email Compromise」,具体为攻击者通过将邮件发件人伪装成你的领导、同事或商业伙伴,以此骗取商业信息或钱财、或者获取其他重要资料。


如今,「变脸」真的发生了。AI 生成的换脸、变声技术可伪造公众人物或亲友身份,用于诈骗、舆论操控甚至政治干预。 就在两个月前,上海某企业财务总监接到来自「董事长」的视频会议邀请,对方通过 AI 换脸仿声称需紧急支付「境外合作保证金」,该总监依指示转 380 万元至指定账户,后识破系境外诈骗团伙利用深度伪造技术作案。


第三则是自动化攻击与漏洞利用。 AI 技术的进步让大量场景向智能化、自动化演进,网络攻击自然也是如此。攻击者可借助 AI 自动扫描系统漏洞、生成动态攻击代码,并对目标实施无差别快速攻击,比如 AI 驱动的「零日攻击」在发现漏洞后会立即编写并执行恶意程序,传统防御系统难以实时响应。


就在今年春节,DeepSeek 官网遭遇 3.2Tbps 超大规模 DDoS 攻击,黑客同步通过 API 渗透注入对抗样本,篡改模型权重导致核心服务瘫痪 48 小时,直接经济损失超数千万美元,事后溯源发现美国 NSA 长期潜伏的渗透痕迹。


数据污染和模型漏洞同样也是一种新威胁。攻击者通过在 AI 训练数据中植入虚假信息(即数据投毒),或利用模型自身缺陷,诱导 AI 输出错误结果 —— 这会对关键领域造成直接的安全威胁,甚至可能引发连锁灾难性后果,例如自动驾驶系统因对抗样本误判「禁止通行」为「限速标志」,或医疗 AI 将良性肿瘤误判为恶性。


AI 还需 AI 治 


面对 AI 驱动的网络安全新威胁,传统防护模式已显乏力。那么,我们又有哪些应对之策呢?


不难发现,目前的业内共识已指向「以 AI 对抗 AI」—— 这不仅是技术手段的升级,更是安全范式的转变。


现有的尝试大致分为三大类,分别是 AI 模型的安全防护技术、行业级的防御应用以及更宏观层面的政府与国际协作。


AI 模型安全防护技术的关键在于模型的内生安全加固。


以大型语言模型(LLM)的「越狱」漏洞为例,其安全防护机制常因通用型越狱提示策略失效 —— 攻击者通过系统性绕过模型内置保护层,诱导 AI 生成暴力、歧视或违法内容。为防止 LLM 的「越狱」,各家模型公司都做出了尝试,比如 Anthropic 就于今年二月发布了「宪法分类器」。


此处的「宪法」指的是不可违背的自然语言规则,作为一种在合成数据上训练的保障措施,通过规定允许和限制的内容,实时监测输入输出内容,在基准条件的测试中,其 Claude3.5 模型在分类器保护下,对高级越狱尝试的成功阻止率从 14% 提升至 95%,显著降低了 AI 的「越狱」风险。


而除了基于模型、更通用的防御手段外,行业级的防御应用同样值得关注,其垂直领域的场景化防护正成为关键突破点:金融行业通过 AI 风控模型与多模态数据分析构建反欺诈壁垒,开源生态借助智能化漏洞猎捕技术实现零日威胁的快速响应,而企业敏感信息保护则依托 AI 驱动的动态管控体系。


例如,思科在新加坡国际网络周展示的方案,可实时拦截员工向 ChatGPT 提交的敏感数据查询请求,并自动生成合规审计报告优化管理闭环。


在宏观层面上,政府与国际的跨区域协作也正加速推进。新加坡网络安全局发布《人工智能系统安全指南》,通过强制本地化部署与数据加密机制约束生成式 AI 滥用,特别针对钓鱼攻击中 AI 伪造身份的识别建立防护标准;美英加三国同步启动「AI 网络代理计划」,聚焦可信系统研发与 APT 攻击的实时评估,通过联合安全认证体系强化集体防御能力。


那么,哪些方法能最大限度地用 AI 来应对 AI 时代的网络安全挑战呢?


「未来需要 AI 安全智能中枢并围绕中枢构建新体系。」在第二届武汉网络安全创新论坛上,青藤云安全创始人张福曾在分享中强调以 AI 对抗 AI 方为未来网络安全防御体系的核心,「3 年内,AI 将会颠覆现有的安全行业,和所有的 2B 行业。产品将会重新构建,实现前所有未有的效率和能力的提升。未来产品是给 AI 用的,而不是给人用的。」


在一众方案中,Security Copilot 的模式显然对「未来产品是给 AI 用的」提供了很好的示范:一年前,微软推出了智能 Microsoft Security Copilot 副驾驶来帮助安全团队迅速准确地检测、调查和响应安全事件;一个月前,又再次发布了用于在钓鱼攻击、数据安全和身份管理等关键领域自动协助的 AI 智能体。



微软新增六个自研 AI 智能体以扩展 Security Copilot 功能。其中三个用于辅助网络安全人员筛选警报:钓鱼分类智能体审查钓鱼警报、过滤误报;另两个分析 Purview 通知,检测员工未经授权使用业务数据的情况。


条件访问优化智能体与 Microsoft Entra 协作,指出不安全的用户访问规则,并生成一键修复方案供管理员执行。漏洞修复智能体和设备管理工具 Intune 集成,助力快速定位易受攻击的终端,应用操作系统补丁。威胁情报简报智能体生成可能威胁组织系统的网络安全威胁报告。


无相:L4 级高阶智能体的保驾护航 


无独有偶,在国内,为了实现真正意义上「自动驾驶」级别的安全防护,青藤云安全推出了全栈式安全智能体「无相」。作为全球首个实现从「辅助型 AI」向「自主智能体」(Autopilot)跨越的安全 AI 产品,其核心突破在于颠覆传统工具的「被动响应」模式,使其自主、自动且智能。



通过融合机器学习、知识图谱与自动化决策技术,「无相」可独立完成威胁检测、影响评估到响应处置的全流程闭环,实现真正意义上的自主决策与目标驱动。其「Agentic AI 架构」设计模拟人类安全团队的协作逻辑:以「大脑」整合网络安全知识库支撑规划能力,「眼睛」细粒度感知网络环境动态,「手脚」灵活调用多样化的安全工具链,并通过多智能体协作形成信息共享的高效研判网络,分工合作、共享信息。


在技术实现上,「无相」采用「ReAct 模式」(Act-Observe-Think-Act 循环)与「Plan AI + Action AI 双引擎架构」,确保复杂任务中的动态纠偏能力。当工具调用异常时,系统可自主切换备用方案而非中断流程,例如在 APT 攻击分析中,Plan AI 作为「组织者」拆解任务目标,Action AI 作为「调查专家」执行日志解析与威胁建模,二者基于实时共享的知识图谱实现并行推进。 


功能模块层面,「无相」构建了完整的自主决策生态: 智能体人设模拟安全分析师的反思迭代思维,动态优化决策路径; 工具调用整合主机安全日志查询、网络威胁情报检索及 LLM 驱动的恶意代码分析; 环境感知实时捕获主机资产与网络信息;知识图谱动态存储实体关联,辅助决策;多智能体协作通过任务分拆与信息共享,并行执行任务。


目前「无相」在告警研判、溯源分析以及输出安全报告这三大核心应用场景中的表现最为出色。


传统安全运营中,海量告警的真伪甄别耗时费力。以一次本地提权告警为例:无相的告警研判智能体自动解析威胁特征,调用进程权限分析、父进程溯源、程序签名验证等工具链,最终判定为误报 —— 全程无需人工介入。在青藤现有告警测试中,该系统已实现 100% 告警覆盖率与 99.99% 研判准确率,并将人工工作量削减超 95%。


面对真实威胁如 Webshell 攻击,智能体通过代码特征提取、文件权限分析等跨维度关联,秒级确认攻击有效性。传统需多部门协作、耗时数日的深度溯源(如上传播径还原、横向影响评估),现由系统自动串联主机日志、网络流量、行为基线等数据流,生成完整攻击链报告,将响应周期从「天」压缩至「分钟」。


「我们的核心是将 AI 和人的合作关系扭转了,可以把 AI 作为一个人来合作,实现从 L2 到 L4 的跨越,即从辅助驾驶向高阶自动驾驶跨越。」青藤联创兼产品副总裁胡俊分享道,「随着 AI 能适配的场景更多,决策的成功率更高,逐渐能够承担更多的责任,这样人和 AI 之间的责任分工就会有变化。」



在溯源分析这个场景中,首先是 Webshell 告警触发「无相 AI」驱动的多智能体安全团队协同溯源:「研判专家」基于告警定位 one.jsp 文件,生成文件内容分析、作者溯源、同目录排查及进程追踪等并行任务,由「安全调查员」智能体调用文件日志工具,快速锁定 java(12606)进程为写入源,该进程及关联主机 10.108.108.23(通过访问日志发现高频交互)相继纳入调查。


智能体通过威胁图谱动态扩展线索,从单一文件逐层深挖至进程、主机,研判专家汇总任务结果综合判定风险。此过程将人工需数小时至数天的排查压缩至几十分钟,以超越人类高级安全专家的精准度还原攻击全链路,无死角追踪横向移动路径,红队评估也显示难以规避其地毯式调查。


「大模型比人工好是因为它能彻查边边角角,而非凭经验排除可能性低的情况。」胡俊解释道,「这样相当于广度和深度都更好。」 



在完成复杂攻击场景的调查后,整理告警与调查线索并生成报告往往耗时费力。而 AI 可实现一键式总结,以可视化时间线的形式清晰呈现攻击过程,如同电影般连贯展示关键节点 —— 系统会自动梳理关键证据生成攻击链的关键帧,并结合环境上下文信息,最终生成动态的攻击链路图谱,让整个攻击轨迹以直观、立体的方式呈现。



结语


很显然,AI 技术的发展为网络安全带来双重挑战。 


一方面,攻击者利用 AI 实现攻击的自动化、个性化和隐蔽化;另一方面,防御方需加速技术创新,通过 AI 增强检测与响应能力。未来,攻防双方的 AI 技术竞赛将决定网络安全的整体态势,而安全智能体的完善将是平衡风险与发展的关键。


而安全智能体「无相」在安全架构与认知层面都带来了新的变化。


「无相」本质上是改变了对 AI 的使用方式,其突破性在于将多维数据感知、防护策略生成与决策可解释性熔铸为有机整体 —— 从过往将 AI 作为工具使用的模式转变为给 AI 赋能使其能自主且自动地工作。


通过关联分析日志、文本、流量等异构数据,系统能在攻击者构建完整攻击链前捕捉 APT 活动的蛛丝马迹。更关键的是,其决策过程的可视化推理解释,让传统工具「知其然不知其所以然」的黑盒告警成为历史 —— 安全团队不仅能看见威胁,更能理解威胁的演化逻辑。


这个革新的本质是安全思维从「亡羊补牢」到「未雨绸缪」的范式跃迁,是对攻防博弈规则的重新定义。


「无相」如同拥有数字直觉的猎手:通过实时建模内存操作等微观行为特征,它能从海量噪声中揪出潜伏的自定义木马;动态攻击面管理引擎持续评估资产风险权重,确保防护资源精准投向关键系统;而威胁情报的智能消化机制,则将日均万条告警转化为可行动的防御指令,甚至预测攻击变种的演化方向 —— 当传统方案还在疲于应对已发生的入侵时,「无相」已在对攻击者的下一步落子进行预判封堵。


「AI 智能中枢系统(高阶安全智能体)的诞生,将会彻底重塑网络安全的格局。而我们唯一需要做的,就是彻底抓住这个机会。」张福道。


©

(文:机器之心)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往