弄明白智能体的运作流程,才能知道智能体目前存在那些问题,以及应该怎么解决

 智能体的运作流程非常复杂和不可控,因此需要其它解决方案来解决这些问题。



从结构上来看智能体的实现非常简单,就是大模型LLM+工具Tools;而构建工具主要有两种方式,Function call和MCP协议。但由于智能体是由大模型自己决定怎么使用工具,以及怎么处理工具需要的参数和返回值。


而这个过程对技术人员是完全不可控的,因此这一点也是智能体执行过程中主要的困难点和风险点;特别是在多链路的工具调用过程中,比如说让模型找到某个景点附近的酒店,并根据要求订房间。



这个时候智能体就需要先执行搜索的功能,再执行下单的功能;而如果在复杂业务场景中,可能需要的链路更长,需要的工具更多;但大模型在这种长距离的思维链路中,很容易产生问题。


因此,才有了多智能体架构的出现,也就是每个智能体只负责单一的功能逻辑,然后把多个智能体组合成一个大的复杂的智能体。但这样同样会产生一些问题,那就是多智能体之间的通讯问题。


而且,在真实的业务场景中,很多业务功能不仅仅只依靠智能体来完成,可能还需要其它业务处理或人工参与;这时一旦出现问题,怎么快速定位问题和解决问题是一个需要思考的问题。


而解决这些问题的前提,就是我们要明白智能体的执行逻辑,这样我们才能知道智能体执行出现问题可能产生的原因。





智能体的执行流程




事实上很多人认为的智能体就是给大模型加一些外部工具,而由此组成的结构就是一个智能体;包括作者刚开始也是这么认为,这种想法虽然不能说有错;但事实上存在一些认知偏差,或者说这可以认为是狭义上的智能体。


智能体(Agent)是指能够感知环境并采取行动以实现特定目标的代理体。它可以是软件硬件或一个系统,具备自主性、适应性和交互能力。智能体通过感知环境中的变化(如通过传感器或数据输入),根据自身学习到的知识和算法进行判断和决策,进而执行动作以影响环境或达到预定的目标。


以上是百度百科关于智能体的定义,从上面可以看出智能体并不是简单的多模型+工具;而是一个能够感知环境并采取行动以实现特定目标的代理体,其主要特点是具备自主性,适应性和交互能力。


所以只需要具备上述特征的系统都可以被称为智能体;而目前的智能体主要依靠大模型来实现,原因就在于目前的大模型具备很强的自主规划能力,然后还可以使用外部工具执行动作。



那为什么说由大模型+工具实现的智能体是狭义上的智能体呢?


因为,这样是最简单的智能体结构;但真实场景中的业务流程远远超过了这种简单结构的处理能力;所以,才需要在智能体系统中加入工作流,用户接口等。


并且,为了保证系统的正常运行和中断运行,需要在系统中断之后还能恢复到之前的状态,因此还需要保存智能体执行过程中的实时数据。


而这些操作虽然从理论上说起来很简单,但在实际操作过程中却面临着各种各样的问题和困难点;特别是随着智能体架构的调整,其某些功能点可能需要重新设计和实现。


而由于大模型本身的不确定性,更为整个智能体系统增加了更多的不可控因素。


比如说这时可能需要进行容错处理,在大模型执行出现问题时,能够提供重试机制或人工介入处理等。







(文:AI探索时代)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往