大模型之后,AI 开始“自己动手”了

采访 | 唐小引
整理 | 张红月
出品丨AI 科技大本营(ID:rgznai100)

从生成式 AI 到 Agentic AI,互联网正在从“信息获取”转向“任务完成”。

强化学习带来的整个推理范式使得智能体的规划能力大大提升,让大模型具备了更强的自主规划与工具调用能力,尤其是在推理链构建、任务分解、多 Agent 协作等方面,能力提升显著。

这一趋势正在引发全球范围的智能体竞赛。


全球科技巨头抢滩智能体


放眼全球,科技巨头纷纷加速 AI Agent 布局:

  • 微软在其 Build 2025 大会上明确提出“AI Agent 将重塑未来的工作方式”,推出了包含预构建智能体与模块化自定义开发的 Copilot Studio 解决方案;

  • Google 则在 I/O 大会上宣布将在 Chrome 浏览器、搜索以及 Gemini 应用中推出智能体模式,AI 智能体可以直接与浏览器和其他软件交互,执行诸如查找信息、预订服务等任务;

  • OpenAI 不仅发布了能自动执行复杂操作的 AI Agent “Operator”,更推出了面向深度研究的智能体功能;

  • Anthropic 则发布了 Agent 最佳实践指南,涵盖任务设计、角色设定、安全边界等关键环节,进一步推动 Agent 工程从概念验证走向工程落地。

国内市场同样热潮涌动,比如在 2025 腾讯云 AI 产业应用峰会上,腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生宣布腾讯各项业务全面拥抱 AI,以大模型、智能体、知识库和基础设施“四个加速”助力 AI 打造普惠生产力。其中,在智能体方面,腾讯云全新升级智能体开发平台(TCADP),旨在融合自身在知识管理、工作流编排以及 AI 能力上的优势,助力企业构建更高效、更智能的 Agent 应用,而大家所熟知的腾讯多项 C 端与 B 端应用,如 QQ 浏览器、腾讯健康、腾讯云代码助手 CodeBuddy、腾讯企点营销云等都加入了智能体的能力。

吴运声,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人

对于今年众多厂商在智能体领域加大投入的现象,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声在接受 CSDN 等采访时表示:这背后反映了技术演进与业务需求的双轮驱动。

他表示大家都看到了两方面:

  • 一是智能体技术快速发展,尤其是其具备自我规划和调用工具完成复杂任务的能力在不断增强;

  • 二是应用业务的发展需求随着技术提升也在增长,智能体能够更好地满足客户复杂多样的场景需求。这两方面共同推动了智能体的快速发展。

为什么今年我们共同迎来了 Agent 的大爆发?吴运声分析道:AI 的发展是一个多维度、全方位的过程,不能将前景聚焦在某一单一形态上。除了智能体,大语言模型、多模态模型、语音模型、视觉模型等也都在快速演进,各有其独特的应用价值和技术挑战。随着近几年来 AI 能力不断成熟,技术和用户需求的匹配度逐渐加深,AI 会在越来越多的场景中体现出实际价值。


智能体爆火的背后

客户需求驱动的 AI 应用范式变革


随着 AI 智能体从概念走向实际应用,特别是在软件工程领域引发的范式变革,其取代程序员的讨论也甚嚣尘上,对此,作为资深程序员,吴运声向 CSDN 特别表示:

AI 卷不走程序员,Agent 的发展将重塑软件工程的工作方式,程序员将从执行者转变为更具创造性的问题构建者。

吴运声进一步分享道,智能体在 ToB 场景下是一种全新的应用形态。它与传统软件的最大区别在于,具备了自主规划能力,能够根据用户自然语言指令,自主调用工具,甚至多个 Agent 协同完成复杂任务。这种范式转变,正是源于客户对个性化、智能化解决方案日益增长的需求。
为进一步提升智能体的实用性和可扩展性,腾讯也在围绕智能体核心能力进行深入研究,具体包括:
  • 如何实现更精准的自主规划与执行
  • 如何实现多 Agent 协同的复杂任务处理
  • 如何构建更高效的工具调用机制
比如在工具调用方面,技术演进非常迅猛,经历了几个阶段:
  •  Function Calling:模型理解用户需求后,直接选择并调用一个工具处理请求。

  •  ReAct 模式:要求模型在调用工具前,必须进行一步明确的思考,说明要解决什么问题,为什么调用这个工具。这一步提升了调用的合理性。

  •  Code Agent(CodeArts):不再是一条一条地调用,而是通过生成完整代码,比如循环结构,来批量调用多个接口并计算结果,执行效率更高。

举个例子:如果要比对中国、日本、新加坡、德国的 iPhone 15 价格,Function Calling 就是一条条查;ReAct 会在每一步加上“我现在要查价格,我现在要调用汇率”;而 Code Agent 会直接生成一段程序,循环遍历各国数据、调用接口、换算汇率、返回结果——高效得多。
视觉、多模态、文本以及智能体技术并非孤立演进,而是彼此协同,共同支撑企业AI应用的落地。近期,腾讯在视觉模型和多模态模型方面的发布节奏明显加快,这同样是出于客户需求驱动的战略考量。
但与此同时,企业在推动智能体落地过程中,也会遇到一些挑战,比如会存在企业内部文档质量参差不齐,导致 RAG 效果不佳,该如何优化等问题,吴运声坦言,这是在实际落地场景中非常常见的难题。为了解决这个问题,腾讯云从多个维度入手:
  • 一是提升数据质量:文档转问答对,直接从文档中自动生成高质量的问答对;
  • 二是提升 RAG 的精准度:文档版本比对,提供工具展示版本差异,确保知识库的实时性和准确性;
  • 三是建立运营机制: 通过运营系统支持,根据用户反馈动态优化知识库,形成持续改进的闭环。
“客户的需求,始终是我们技术迭代的源动力。”吴运声强调。
目前,腾讯云与各行业的客户展开了广泛合作,智能体应用已在汽车、金融、文旅、消费电子、医药连锁、零售等行业落地。这些应用不再是概念验证,而是在生产环境中真实运行的场景。例如:
  • 汽车行业: 售后知识支持、故障自诊断
  • 金融行业: 智能客服、知识库问答
  • 文旅行业: 行程规划、票务问询
  • 消费电子、家电行业: 产品推荐、使用指南
  • 医药连锁、零售行业: 商品问答、门店引导
这些都已经不是概念验证,而是在生产环境中真实落地的场景。
从全球趋势到本地实践,从底层模型到平台系统,Agent 的进化路径清晰而迅猛。

腾讯云智能体开发平台的推出,不只是发布一款新工具,更是在构建一个企业可控、可用、可落地的智能应用系统。这不仅是一种平台能力的释放,也是在为“AI 重塑产业”的未来搭建“新基建”。

智能体不是一时风口,而是大模型落地过程中最具系统性、可扩展性与变革性的路径之一。

(文:AI科技大本营)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往