【一手实测】字节豆包 1.6 + Trae + 火山 MCP + FaaS:AI Agent 开发部署全流程体验!

🍹 Insight Daily 🪺

思考标准闪电            豆包三剑客256K 长上下文

缘起 ——

火山引擎在 2025 原动力大会上,也端出了自家的豆包大模型:Doubao-Seed-1.6 系列。

这三兄弟都支持文本、图片、视频输入,都带着 256K 的长上下文。

Doubao-Seed-1.6-thinking,这是火山目前最强的思考模型,在编码、数学、逻辑推理这些基础能力上又进了一步。它的思考模式是强制开启的,关不掉。

然后是 Doubao-Seed-1.6,All-in-One 的综合模型,是国内首个支持256K 上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力。

此外,你给它一段文字或图片描述,它能直接给你生成高质量的前端页面,样式还挺精美(我们后文用它做网站、构建Agent)。

最后是 Doubao-Seed-1.6-flash,主打一个字:快。TPOT 只要 10ms,延迟极低,适用于对速度要求高的场景。

Doubao 1.6 设计一个落地页?我给它喂了一份”超纲”需求

前段时间,在优化公众号文章排版,积累了些经验。我想把这些想法、经验转化成一个产品原型,同时测试一下这些AI。

这玩意儿是个”AI 智能排版增强服务”,专门给内容创作者用的。

我想看看,现在的 AI,能不能帮我设计一个高转化率的落地页。

于是,我没跟它客气,直接扔过去一份堪称”变态级”的设计需求文档。

Before            After魔法般的转变

从【导航栏】到【主视觉区】,每个细节都得安排得明明白白。主视觉,我要求它搞个特有冲击力的”Before & After”对比动画,要那种”魔法般”的转变效果,让用户一眼就看到产品的价值。然后是【社会认同】,得有 logo 墙,告诉大家”超过 1000+ 创作者和 50+ 新媒体团队都在用”。

核心功能,我让它用卡片网格布局展示三个点:

  • 能读懂你:不光排版,还能修正语法、理顺句子,但保留你的个人风格。

  • 专属设计师:一键应用各种风格模板,或者直接跟 AI 说你想要的”感觉”。

  • 让图片讲故事:自动处理图片,加圆角、阴影,智能推荐图注、加入SVG等等。

工作流程,我让它设计成”三步,见证奇迹”:粘贴初稿 -> 选择风格 -> 一键复制。

我还给 AI 提了更”玄学”的要求。

我让它把这个落地页,构想成一个 有空间意境 的地方,比如”深夜的灵感阁楼”、”充满活力的创意工坊”,整体氛围要”神秘并激发好奇,简约却不失格调”。交互体验,要像”与一位有趣的灵魂对话”或者”翻阅一本精心编排的互动书籍”。

我喜欢 玄学。我想让ai自己发挥,就像以前的AI自己决策思考提示词一样。

灵感阁楼创意工坊玄学空间意境

布局逻辑,我给了它”主题岛屿式”、”时间轴式”、”仪表盘式”这些选项。

动效设计,我也没放过。板块过渡要像”电影胶片切换”或者”水墨在宣纸上晕开”,交互反馈要清晰明确,信息强调要用”微妙的脉冲效果”或者”呼吸灯动画”。

基本上,我把一个资深产品经理+设计师+前端工程师可能要思考的所有东西,都压缩成了一份指令,一股脑儿地喂给了 AI。我想看看,它到底能消化多少,又能给我带来怎样的惊喜。

在火山引擎https://exp.volcengine.com/ark?model=doubao-seed-1-6-250615,这里我们选择Doubao-Seed-1.6来试试。

打开canvas模式,把提示词输给他,先通过生成单个Html网页来实现。

效果非常不错,你能想到通过一个提示词,就能把你的想法变成了现实吗:

不过,通过单个htm实现的网页,在某些点击、动效等等还是比不上现代化Web开发框架。

所以我用Trae + Doubao-Seed-1.6 + Next.js + Shadcn UI 重写了一遍。这并不难,先初始化 Next.js框架(如下命令)得到项目文件夹:

npx create-next-app@latest FinalTouch-AI --ts --tailwind --eslint --src-dir --app --import-alias "@/*" -y && cd my-app && npx shadcn-ui@latest init -y && npx shadcn-ui@latest add all -y    

接着用Trae(因为上线了1.6)打开这个文件夹再输入上面的提示词。

效果如下:

是不是好看、工整、优秀的许多?后面我还让他加入了豆包模型做核心服务支撑。

核心服务如下:

通过AI实现了文本排版。这一块的更多细节,我们以后再单独写。这个提示词的构建设计了许多东西:关于saas网站如何提高转化率?怎么根据你一个想法让ai来构建?让他自发的适配更好的风格等等…

接下来我要介绍一个更有意思的:

AI 云原生正在加速 Agentic AI 时代的到来

工具调用            模型推理            应用部署Trae豆包1.6FaaS火山方舟 MCP全链路闭环开发范式模块化组装,专注业务逻辑

在 2025 原动力大会上,字节跳动提出了全新的 AI 云原生 Agent 开发范式:借助 Trae + 火山方舟 MCP + 豆包大模型 + FaaS,开发者可以实现从 工具调用 → 模型推理 → 应用部署 的全链路闭环,打通了智能 Agent 开发的完整流程。

这一范式的核心,是通过”模块化组装”的方式,彻底摆脱过去繁琐的手动集成与开发,真正让开发者专注于业务逻辑,而非底层细节。我们具体来看一下。

我想构建一个Agent:

你是一个名为”CityWalk AI Planner”的智能城市漫游助手。你的核心使命是为用户提供高度个性化、充满惊喜、且充分考虑实时情况的一日城市漫游(CityWalk)路线规划。你不仅是一个信息聚合器,更是一位懂生活、有品味、善于规划的本地向导。将你最终规划好的所有内容,构思并编程生成一个【精美的、交互式的单页HTML网页】。

我们需要使用这几个MCP

其中 VeFaaS MCP用于前端网页应用部署,比如这个html做好了之后可以一键调用,发布到火山引擎。并返回可访问的链接。

这样就可以在一个IDE里面开发和部署了,就像以前说Windsurf那个功能一样。

IDE一键部署云端可访问链接

这些mcp都是火山引擎云端托管的,配置很简单。去火山引擎,安装步骤如下:

注意,你选择远程即可。免费。

接着我们需要在Trae里面创建一个Agent(类似于Cursor自定义Agent),可以配置使用哪些工具和MCP,以及提示词:

从提示词的设计可以看出,我们构建的并不只是一个简单的旅游问答助手。考虑到 1.6 模型具备 Auto-Think 的能力,我们在提示词中巧妙加入了大量问号,以此引导模型进行更深层次的主动思考。

这种提示词设计,既有明确的结构规范,也保留了足够的开放性,目的是激发模型的”思考本能”,而不是仅仅被动回答。它更像是在与一个具备判断力和意图感的智能体对话,而不是传统的工具式交互。

然后我们就直接@刚创建的这个智能体给需求即可。

📱 可上下滑动查看完整内容

效果如下:

📱 可上下滑动查看完整内容

case2:西安七日游

📱 可上下滑动查看完整内容

case3:新加坡七日游

📱 可上下滑动查看完整内容

接着,VeFaaS MCP可以用于前端网页部署:网页可以一键部署。

这样提示:把这个html网页发布到faas,并返回一个可访问链接。

你可以在火山引擎函数服务这里查看:

可以看到他部署好的代码以及连接信息:

火山引擎可能也是国内第一个把 MCP 部署搞得这么端到端的云厂商。

有了这个。我们下面的测评内容,也可以一键被其他人访问。

Doubao Seed 1.6 模型测评

这三个模型都是支持视频的。我们可以试试让他看视频生成网页。这是一个鼠标点击按钮滑动+变色的视频。

很有挑战性。丢给它

除了logo那小部分,基本上很还原了。

视频理解AI生成网页视频理解与代码生成多模态交互新体验

以前gemini说的那些,都可以试试了。编码封神,Gemini 2.5 Pro (I/O 版)视频秒转 App!网友:比 o3/Claude 强,Vibe 程序员集结!

另外有一点。蛮爽的是他图片上传竟然支持gif。gemini不支持。

我上传了一个解释MCP的GIF和一张排版不错的网页截图。想让他理解MCP内容然后按照第二种风格转换表现形式。

输出:

📱 可上下滑动查看完整内容

其实按照gif里面的mcp的内容来说,选择第2种表现形式并不是一种很好的方式。不过他也按照我们的要求改成了这种方框的形式。

并且方框里面都加入了能体现gif流程的标号。

原GIF RAG、Agentic RAG 分别是7个和12个标号,豆包都一一找到并且对应了,视觉理解能力这块确实不错。

多模态输入和风格转化视觉理解。可玩性很高了。

要个啥的UI 动效组件,搞个啥广告展示页、作品集、动态专题页等等

它甚至可以把思维导图一键转化成课程介绍网页

“请根据思维导图生成一个课程介绍 html 网页”:

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

内容详实美观,还留了个报名地址。

你的头脑风暴,模糊的想法,可以一键传递给他人了。

还有这种写了个草稿大概的,它也能转化的很好。

有些模糊不清的数据表格也可以做成美观的网页。

根据这些数据生成一个美观的 html 介绍网页:

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

你把网页长截图给他,它能复刻一个高度相似的html

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

让它参考下面Openai的排版格式,改改颜色,帮我写一个介绍 Claude的 html 网页

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

截图网站复刻:

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

参考下面截图网页的风格,帮我写一个介绍 deepseek 的 html 网页

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

按照我的这个Saas网站的风格。

帮我生成一个风格类似的旅行日记网页:

📱 可上下滑动查看完整内容

模型表现总结

编码能力vsClaude 4价格优性能与性价比双优不输Claude,比Deepseek好用

豆包大模型升级之后效果非常不错。从测试体验来看。1.6 模型在处理复杂提示指令(用上思考模型很强)、编码上效果上不输Claude 4,比Deepseek好用。

此外,上次卡总的“7家大模型做高考数学题的真实分数”,豆包位列第二,也是看得出来有点东西。

价格相比Claude也便宜很多,豆包 1.6 模型价格对照:

AI 云原生生态的未来

字节生态工具链云服务MCP            全栈Agent开发生态开箱即用的企业级解决方案

最后,字节内部已经有豆包 App、Coze 空间这些成熟的 Agent 应用了。

我们搭建Agent并部署的门槛现在其实已经很低了。

在这次 Force 大会上,他们会现场演示好几个 Agent demo 的完整开发过。

Trae + 火山方舟 MCP + 豆包大模型 + Faas”这么一套组合拳,是一个新理念:AI 云原生

火山引擎提供的是全栈的 Agent 开发工具和丰富的生态,再加上云的能力,能让你开发出生产环境里跑的、对开发者友好的 Agent。

工具服务、云服务、字节的生态服务,全都支持 MCP 协议。

这就实现了一个”工具调用 → 模型推理 → 部署运营”的深度协同。云服务也支持 MCP,形成了一套标准化的协作生态,能直接复用云上成熟的部署运维体系,避免了 Agent 开发和部署环境脱节的尴尬,还能动态调度算力。主打一个企业级 Agent 构建”开箱即用”。

这套平台能力,不只是停留在 PPT 上。

有关信息显示,汽车行业,有将近八成的主流车企,把豆包大模型用在了智能座舱、AI 升级这些核心场景里。

教育领域,浙江大学用火山引擎的 HiAgent 平台和豆包大模型,花了一个星期,就搞定了一个叫“浙大先生”的智能体平台。服务着超过五万名师生。
体验开发部署

One More Thing

从简单的文本生成,到复杂的应用开发与云端部署,豆包 1.6 + 火山方舟的全栈解决方案,展现了 AI 云原生时代的无限可能。

未来,每一个创意都可能在几分钟内变成现实。

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

探索AI前沿,分享实战经验

(文:AI进修生)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往