智能体时代来临，阿里云提出大模型效率与效果兼备的金融级解法

内容丨特工少女特工小天

审核丨特工小猹

在过去一年里，Agent 这个词频频出现在 AI 技术趋势榜单上，也迅速成为金融科技领域讨论的热门。然而，真正让 Agent 技术从实验室走进金融一线业务，并非想象中那般顺利。

尽管不少金融机构已经搭建了 Agent 系统，试图用于投研分析、客服自动化、报表生成等场景，但结果却常常“不够智能”“流程太重”“效果不佳”——技术空转、难以落地，成为行业共识中的隐性焦虑。

问题出在哪？是大模型本身的能力不足，还是 Agent 的架构设计出了偏差？

抱着这样的问题，我们参与了本次阿里云 AI 势能大会·金融创新峰会，在会上，阿里云智能集团副总裁、新金融行业总经理张翅，做了一个主题为「元认知·创思记」的分享，内容包括了 AI 的发展历程，以及阿里云在金融行业的一些 AI 实践。

摄于大会现场

会后，我们非常荣幸的与张翅进行了一个专访。在长达一个小时的深入对谈中，他不仅系统阐述了阿里云在金融智能体方向上的战略布局，更结合大量一线案例，直面当前金融机构在 Agent 落地过程中的常见误区与实际难题，以下为完整对话内容。

从观望到拥抱：金融行业对大模型的认知跃迁

：大模型在金融场景中的落地，尤其是今年年初之后出现了非常大的变化。请问当前面临的关键挑战有哪些？与之前相比有哪些变化？面对这样的变化，阿里云有哪些思考和下一步行动？

：首先是认知上的变化。之前很多金融机构还在路线选择上摇摆不定，比如要不要做预训练，选择什么样的场景落地，大模型是否真的能在金融行业发挥价值。金融行业对技术门槛、监管合规、准确性等方面的要求都很高，所以过去一段时间大家处于观望状态，只有少数投顾机构在 AI 投入和创新上比较积极。

但去年九月份之后，随着国家对民营企业和整个市场政策的变化，金融行业经历了一段时间的“练内功”过程，做核心系统、信创、基础设施建设。现在每个金融机构都真切感受到了大模型的火热和压力，这是认知上最大的变化——从观望到快速拥抱，这个转变速度之快在我从业多年都很少见。

现在面临的挑战是：在大家认知高度统一、拥抱节奏这么快的情况下，我们如何提供“AI 平权”方案，让不同规模的机构（大银行、小银行、保险、证券等）都能找到相对清晰确定的落地路线。

我们不是说自己的路线就是绝对标准，但要在模型工程、数据工程、应用工程等方面实现较好的结合，让金融机构不需要投入很高成本、很长周期或大量人才准备，就能快速响应 AI 浪潮。

这也是为什么我们今天开这个会，做一些产品发布。我们也是被市场需求推动着快速迭代产品，包括开源模型能力、优化落地方案、完善基础设施等。

重定义 Agent：模型内化能力才是真智能

：金融机构应该如何利用 Agent 技术实现个性化服务？这里面存在哪些技术难点？如何才能避免出现技术空转的情况？

：这里存在一个常见的误解：很多人容易把 Agent 简单理解为流程编排工具或低代码编排平台，再结合复杂的 Prompt Engineering。这样做出来的工具使用起来很麻烦，也容易出现“技术空转”问题。

因为业务部门会发现 AI 还不够智能——金融业务流程通常很复杂，需要设计很多步骤来避免幻觉、确保回答质量，这些都依赖人工编写（比如应该怎么提问、怎么回答）。如果每一步都要靠人工设计，就不够智能了。

正确的方向是通过强化学习把 Agent 的泛化能力训练到模型内部，而不是依赖工程平台。我们认为真正的 Agent 等于模型能力，不是工具、不是流程编排，也不是 Prompt Engineering 加编排组合。要把这些能力变成模型的内在能力，可以先训练小模型，再整合成大模型。

举个例子：新闻稿件设计。模型应该能够按照媒体机构的审稿规则，自动完成文字校对和逻辑检查。这个过程的挑战是需要懂后训练、蒸馏等技术的人才，建立闭环流程——资深编辑指导模型什么样的稿件结构、内容长度是合格的，通过不断迭代提升质量。这就像老师教学生的过程。

同理，金融领域的审计报告、财务报告、投研报告等，也都是将行业知识（如审计规则、信贷准入标准、理财建议逻辑等）通过训练让大模型掌握。不同岗位的专业知识都可以通过这种方式让模型学习，这就是基础模型与行业岗位结合的价值。

MoA 架构：大模型+专业模型的专业共舞

：关于 MoA 架构的选择，金融机构目前是什么样的考虑？应该如何选择和实现？

：对金融机构来说，与模型公司或互联网公司不同，不能简单地选择 MoE 架构。互联网公司可以坚定拥抱大模型，因为它们的业务流程没有金融行业这么复杂多变。

金融行业有各种细分岗位需求，我们建议采用 MoA 架构。这里的 A 指的是专属垂类模型——基础大模型与成千上万不同岗位的蒸馏小尺寸模型结合。不能把所有能力都统一到一个基础模型中，所以采用这种“通识教育+专业教育”的模式：

基础大模型提供通用智能（相当于通识教育）
各领域小尺寸模型提供专业能力（如审计、风控等专业领域）

小尺寸模型可以用很少的算力，基于自身业务数据快速实现专业价值。不像以前需要把数据送到大模型重新训练——就像一个人同时学 100 门课很难，但专精一门课就容易得多。

目前很多大行已经意识到，自己投入做基础大模型很难竞争过专业模型公司。它们现在的策略是：基础模型选择开源方案（如 DeepSeek、通义千问等），然后自己做强化学习和蒸馏，将专有数据与开源模型结合，训练出专属垂类模型。

MoA 架构的优势在于：当基础模型迭代更新时，只需对小模型重新做两周左右的蒸馏即可，不需要几个月重新训练。这样金融机构可以灵活切换不同开源模型（比如发现 Qwen 效果更好时），所需算力少、时间短。

数据飞轮：让模型像人一样积累经验

：阿里云的数据飞轮解决方案主要帮助金融机构解决什么问题？特别是如何解决大模型幻觉问题？金融机构使用这个产品时，如何结合自身数据实现更简单高效的落地？

：数据飞轮解决方案是实现 MoA 架构的关键。解决幻觉问题有几个层面：

第一，RAG（检索增强生成）仍然是基础方法，不能完全抛弃。但对于复杂任务，仅靠 RAG 是不够的，因为它难以理解深层意图和执行多步操作。比如生成审计报告涉及很多步骤，仅靠 RAG 无法保证准确性和一致性。

我们的方法是在 MoA 架构中加入专业校验小模型。比如审计场景，可以训练一个专门负责核对的小模型。人类审计员会使用各种工具检查报告（如数据勾稽、文字一致性、计算验证等），我们可以把这些检查能力也训练到模型中。

具体实现上：

1. 首先构建简单的 Agent 框架，不追求过于复杂的智能体；

2.选择具体业务场景，设计清晰的步骤流程；

3.将业务规则和知识训练到模型中，而非硬编码；

4.通过持续学习不断优化（如从 70 分提升到 85 分）。

这就像人类工作经验积累的过程，只不过模型学习速度更快。通过足够多的优质样本和反馈循环，模型可以快速达到专业水平。

三大战略：全栈模型、Agent 深化、生态融合

：现在金融机构都在拥抱大模型，阿里云下一步的重点会放在什么地方？

：阿里云的特点是我们提供全栈能力。重点方向有三个：

第一，模型层面坚持“全尺寸”策略，从基础模型到推理模型到融合模型都会布局。不同行业对模型的需求差异很大，我们会针对金融、互联网等行业特点发展专用模型。

第二，深化 Agent 能力。今天邀请夸克、羚羊等业务部门来分享，就是因为阿里巴巴内部各业务都在 Agent 化和 AI 化。我们会把这种经验助力给金融机构。

第三，生态融合。未来可能不再是 APP 时代，而是智能体时代。比如养老金融服务可以嵌入高德的打车优惠，旅行规划可以结合飞猪的酒店服务。这种跨业务场景的智能融合会创造新价值。

未来的竞争不再是抢占入口，而是比拼智能服务质量。金融机构需要建立自己的智能服务体系，这可能类似于操作系统概念——金融 OA 系统将演变为智能体平台。

从 RAG 到 Agent：用可观测系统量化真实价值

：在金融行业落地时，如何有效评估实际效果和业务价值？会上提到的Agent可观测评测系统能力如何？

：目前评估结果很积极：

1. 意图理解准确率已从原来的水平提升到 90%-99%；

2. 传统 RAG 方法正在被快速替代；

3. 业务部门实测后直接要求上线（因为效果明显提升）。

复杂任务场景还在完善中，但方向已获得行业认可。过去一年大家主要用 RAG 和 Prompt Engineering，现在这些方法正在被更先进的模型架构替代。

我们推出的可观测评测系统能提供量化指标（如准确率、任务完成度等），帮助机构客观评估效果。同时通过展示生态伙伴的实际案例（如某业务场景使用某模型取得什么提升），让金融机构更直观地理解应用价值。

（文：特工宇宙）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

从 RAG 到 Agent：用可观测系统量化真实价值

：在金融行业落地时，如何有效评估实际效果和业务价值？会上提到的Agent可观测评测系统能力如何？

发表评论 取消回复

发表评论取消回复