弄明白智能体的运作流程，才能知道智能体目前存在那些问题，以及应该怎么解决

“ 智能体的运作流程非常复杂和不可控，因此需要其它解决方案来解决这些问题。”

从结构上来看智能体的实现非常简单，就是大模型LLM+工具Tools；而构建工具主要有两种方式，Function call和MCP协议。但由于智能体是由大模型自己决定怎么使用工具，以及怎么处理工具需要的参数和返回值。

而这个过程对技术人员是完全不可控的，因此这一点也是智能体执行过程中主要的困难点和风险点；特别是在多链路的工具调用过程中，比如说让模型找到某个景点附近的酒店，并根据要求订房间。

这个时候智能体就需要先执行搜索的功能，再执行下单的功能；而如果在复杂业务场景中，可能需要的链路更长，需要的工具更多；但大模型在这种长距离的思维链路中，很容易产生问题。

因此，才有了多智能体架构的出现，也就是每个智能体只负责单一的功能逻辑，然后把多个智能体组合成一个大的复杂的智能体。但这样同样会产生一些问题，那就是多智能体之间的通讯问题。

而且，在真实的业务场景中，很多业务功能不仅仅只依靠智能体来完成，可能还需要其它业务处理或人工参与；这时一旦出现问题，怎么快速定位问题和解决问题是一个需要思考的问题。

而解决这些问题的前提，就是我们要明白智能体的执行逻辑，这样我们才能知道智能体执行出现问题可能产生的原因。

智能体的执行流程

事实上很多人认为的智能体就是给大模型加一些外部工具，而由此组成的结构就是一个智能体；包括作者刚开始也是这么认为，这种想法虽然不能说有错；但事实上存在一些认知偏差，或者说这可以认为是狭义上的智能体。

智能体（Agent）是指能够感知环境并采取行动以实现特定目标的代理体。它可以是软件、硬件或一个系统，具备自主性、适应性和交互能力。智能体通过感知环境中的变化（如通过传感器或数据输入），根据自身学习到的知识和算法进行判断和决策，进而执行动作以影响环境或达到预定的目标。

以上是百度百科关于智能体的定义，从上面可以看出智能体并不是简单的多模型+工具；而是一个能够感知环境并采取行动以实现特定目标的代理体，其主要特点是具备自主性，适应性和交互能力。

所以只需要具备上述特征的系统都可以被称为智能体；而目前的智能体主要依靠大模型来实现，原因就在于目前的大模型具备很强的自主规划能力，然后还可以使用外部工具执行动作。

那为什么说由大模型+工具实现的智能体是狭义上的智能体呢？

因为，这样是最简单的智能体结构；但真实场景中的业务流程远远超过了这种简单结构的处理能力；所以，才需要在智能体系统中加入工作流，用户接口等。

并且，为了保证系统的正常运行和中断运行，需要在系统中断之后还能恢复到之前的状态，因此还需要保存智能体执行过程中的实时数据。

而这些操作虽然从理论上说起来很简单，但在实际操作过程中却面临着各种各样的问题和困难点；特别是随着智能体架构的调整，其某些功能点可能需要重新设计和实现。

而由于大模型本身的不确定性，更为整个智能体系统增加了更多的不可控因素。

比如说这时可能需要进行容错处理，在大模型执行出现问题时，能够提供重试机制或人工介入处理等。

（文：AI探索时代）