关注我,记得标星⭐️不迷路哦~
在企业级 AI 应用蓬勃发展的今天,如何让不同框架和供应商构建的 AI 智能体能够无缝协作,成为了释放 AI 潜力的关键. 为了解决这一挑战,谷歌正式推出了全新的开放协议——Agent2Agent (A2A).旨在为各种 AI 代理生态系统提供通用的通信标准,实现跨平台、跨应用的智能体协作,从而提高生产力、自动化复杂工作流程并降低长期成本.
✨ A2A:智能体之间的“通用语言”
想象一下,您的企业内部署了多个功能各异的 AI 智能体,它们可能由不同的团队使用不同的技术栈开发,服务于不同的业务系统,例如客户关系管理 (CRM)、人力资源管理 (HRM)、供应链管理等. 在 A2A 协议出现之前,这些智能体往往像一个个孤岛,难以相互沟通和协作,严重制约了 AI 在解决复杂问题上的能力.
A2A 的核心目标正是打破这些壁垒,让不同来源、不同技术的 AI 智能体能够相互沟通、安全地交换信息,并协同执行跨企业平台或应用的复杂任务. 就像为智能体团队制定了统一的沟通规则和工作流程,A2A 确保了它们能够“听懂对方的话,高效合作”.
✨ 强大的生态支持:超过 50 家合作伙伴鼎力支持
A2A 协议的发布得到了业界的广泛关注和积极响应. 超过 50 家技术合作伙伴和领先的服务提供商参与了 A2A 的支持与贡献,包括 Atlassian, Box, Cohere, Intuit, Langchain, MongoDB, PayPal, Salesforce, SAP, ServiceNow, UKG, Workday 等技术平台, 以及 Accenture, BCG, Capgemini, Deloitte, KPMG, PwC, TCS, Wipro 等服务机构. 如此庞大的生态支持,预示着 A2A 有望成为未来智能体交互的事实标准.

✨A2A 的核心设计原则
在设计 A2A 协议时,谷歌及其合作伙伴遵循了五个关键原则:
- 拥抱智能体原生能力 (Embrace agentic capabilities):
A2A 旨在让智能体以其自然的、非结构化的方式进行协作,即使它们不共享内存、工具或上下文. 目标是实现真正的多智能体场景,而非将智能体局限为简单的“工具”. - 基于现有标准构建 (Build on existing standards):
协议建立在广泛使用的现有标准之上,包括 HTTP, SSE (Server-Sent Events), JSON-RPC. 这意味着企业可以更容易地将其集成到现有的 IT 技术栈中,无需大费周章地重新搭建复杂的数据传输通道. - 默认安全 (Secure by default):
A2A 设计支持企业级的身份验证和授权,在发布时与 OpenAPI 的身份验证方案具有对等性. 这保障了数据传输的安全性和合规性,防止数据泄露风险. - 支持长时任务 (Support for long-running tasks):
协议设计灵活,既能处理快速任务,也支持可能需要数小时甚至数天(尤其当有人工介入时)的深度研究. 在此过程中,A2A 能提供实时反馈、通知和状态更新,让用户随时掌握任务进展. - 模态无关 (Modality agnostic):
智能体的世界不止于文本. A2A 支持多种模态,包括音频、图像和视频流,从而提供更丰富的交互方式.
✨A2A 的工作原理
A2A 协议的核心在于促进客户端智能体 (client agent) 和远程智能体 (remote agent) 之间的通信. 客户端智能体负责制定和传达任务,而远程智能体则负责执行这些任务以提供信息或采取行动. 这种交互过程包含以下关键能力:
- 能力发现 (Capability discovery):
每个能提供服务的智能体(服务端智能体)会准备一张电子“名片” (Agent Card). 这张名片以 JSON 格式存在,描述了智能体的名字、联系方式(URL)、提供的服务或技能,以及能处理的信息格式和工作风格等. 客户端智能体在寻找帮手时,会先去读取这些名片,从而找到最适合执行某项任务的远程智能体,并发起 A2A 通信. - 任务管理 (Task management):
客户端智能体将工作要求打包成一个结构化的“工作委托单” (Task). 通信围绕任务完成进行,任务对象由协议定义,并具有完整的生命周期. 任务可以是即时完成的,也可以是需要较长时间处理的. 在任务执行过程中,智能体之间可以持续同步状态,确保彼此了解任务的最新进展. 任务完成后会生成“交付物” (Artifact),例如图像、文本或其他形式的输出. - 协作 (Collaboration):
智能体之间可以互发“消息” (Message),用于传递上下文信息、用户指令、任务结果等,实现真正的多智能体协同工作. - 用户体验协商 (User experience negotiation):
每条消息可以包含多个“内容部分” (Parts),每个部分都是一个完整的内容单元,比如一张生成的图片. 每个部分都有指定的内容类型,这使得客户端和远程智能体能够协商所需的正确格式,并且明确包括用户界面能力的协商,比如是否支持 iframe、视频、网络表单等. 这样,A2A 就能够根据用户的需求和设备的能力,提供最佳的用户体验.
✨ A2A 与 MCP:互补而非替代
值得强调的是,A2A 协议是对 Anthropic 公司模型上下文协议 (MCP) 的补充,而不是替代关系. MCP 主要关注连接 LLM 和数据、资源和工具的标准,可以看作是连接 AI 模型与各种数据源和工具的“USB-C 接口”. 而 A2A 则专注于实现不同智能体之间的自然协作和通信. 谷歌希望 A2A 能够作为 MCP 的补充被广泛采用,共同推动智能体生态系统的发展. 在汽车修理厂的例子中,MCP 可以理解为将智能体与其工具连接的协议(例如,控制千斤顶),而 A2A 则是使终端用户或其他智能体能够与修理厂员工(智能体)协作的协议(例如,“我的车发出异响”),并帮助修理厂员工与其他智能体(如零件供应商)协作.
✨ 实际应用场景展望
A2A 协议的潜力是巨大的,它将在各种实际应用场景中发挥关键作用:
- 招聘流程自动化
不同智能体可以协作完成候选人搜寻、面试安排和背景调查等环节,显著提高招聘效率. - 跨企业应用的工作流程自动化
打破数据孤岛,使得构建在不同平台上的智能体能够相互通信和协调,例如电商平台的订单管理智能体与库存管理系统的智能体进行实时交互. - 复杂问题解决和知识整合
促进专业化智能体的开发,当需要解决复杂问题时,一个协调智能体可以与多个专业智能体协作,汇集各自的知识和能力,例如在新药研发过程中,不同智能体分别负责分子设计、反应模拟和临床试验分析. - 个性化用户体验和多模态交互
根据用户的设备和界面能力,智能体可以协商最佳的内容呈现方式,支持文本、音频、图像和视频等多种模态的交互. - 跨组织协作
支持不同组织之间的智能体进行沟通,例如汽车修理厂的智能体与零件供应商的智能体进行零件查询和订购.
Agent2Agent (A2A) 协议的发布标志着 AI 智能体互操作新时代的开启. 它为不同 AI 智能体之间的有效沟通和协作提供了通用的标准,有望打破 AI 生态系统中的壁垒,促进创新,构建更强大和通用的智能体系统.
地址:https://github.com/google/A2A
(文:每日AI新工具)