

开源,从模型到应用
最近,大家都被Manus刷屏了。
抛开争议不谈,由“聊天助手”到“任务代理”的新范式转变,大大拓展了人工智能的能力边界。2025年是AI应用大年,正在成为越来越多人的共识。
但从大模型到应用,很多企业被卡在了最后一公里。比如,大家常遇到的这些问题:
-
不知道自己的应用场景是什么,能用DeepSeek大模型做什么?
-
DeepSeek虽然能力出众,但以AI Chat为主的应用场景太单一,该怎样集成多模态模型,打造更有趣、更实用的应用?
-
应用研发看着不难,但实际落地才发现还需要各种大模型插件,技术难度太大!
这些问题,在过去一年中持续困扰着各个行业,也是我们在与一些企业一起探索的难题。
现在,这个难题似乎有解了。最近,在我使用火山引擎中,发现他们新上线了一个“大模型应用实验室”,并一口气开源了多个AI应用。

无论是企业、独立开发者还是个人爱好者,都可以通过“大模型应用实验室”一键复制开源代码,快速搭建AI应用,实现开箱即用。
开源地址:
https://github.com/volcengine/ai-app-lab
不得不说,这事很有意义,因为开源模型很多,但是开源应用却很少。火山引擎这一步,对推动大模型发展有重大价值。

手搓一个应用
下面,我带大家来手搓一个AI应用。
以最近很火的Deep Research为例,相信你近期也在ChatGPT、Grok、Manus上体验到了类似功能。
先给大家简要介绍下它的原理。
Deep Research是利用DeepSeek-R1/Claude 3.7大模型对复杂问题进行多角度分析,并辅助互联网资料,快速生成最合适用户的解决方案。无论是在学术研究、企业决策还是产品调研中,Deep Research都能够有效地协助用户深入挖掘,提出切实可行的解决策略。
整个架构如下:

了解了原理和架构后,接下来我们就正式开始手搓了。
首先,我们到github下载代码仓库。
# 仓库下载
git clone https://github.com/volcengine/ai-app-lab.git
# 进入对应具体目录
cd demohouse/chat2cartoon
然后,设置环境变量,添加DeepSeek-R1模型或tavily搜索引擎。
如果使用火山方舟零代码联网应用作为搜索引擎,请设置如下环境变量:
# 填写火山方舟API KEY
export ARK_API_KEY=xxx-xxxx-xxx-xxx
# 思考模型名称,填写deepseek-r1-250120
export REASONING_MODEL=deepseek-r1-250120
# 设置使用火山方舟零代码联网应用作为搜索引擎
export SEARCH_ENGINE=volc_bot
# 配置火山方舟零代码联网应用的bot id
export SEARCH_BOT_ID=bot-xxxxxx-xx
如果使用tavily作为搜索引擎,请设置如下环境变量:
# 填写火山方舟API KEY
export ARK_API_KEY=xxx-xxxx-xxx-xxx
# 思考模型名称,填写deepseek-r1-250120
export REASONING_MODEL=deepseek-r1-250120
# 设置使用tavily作为搜索引擎
export SEARCH_ENGINE=tavily
# 配置tavily的APIKEY
export TAVILY_API_KEY=xxx-xxx-xxx-xxx
其次,安装项目依赖并运行。
通常,默认在localhost:8888提供符合openAI规范的chatAPI服务。
python -m venv .venv
source .venv/bin/activate
poetry install
poetry run python -m server
接着,启动webui。
# 需要先设置连接本地服务器
export
API_ADDR=http://localhost:8888/api/v3/bots
python -m venv .venv
source .venv/bin/activate
poetry install
# 启动web ui
poetry run python -m webui
这样,你的Deep Research应用就开发好了。
打开浏览器访问http://localhost:7860/,即可使用。

以上介绍的,是本地部署的方式。你也可以通过火山方舟进行部署。

部署指引:
https://github.com/volcengine/ai-app-lab/tree/main/demohouse/deep_research

更多开源应用
除了Deep Research外,火山引擎还开源了多个应用。
比如「双语视频生成器」,用户只需要输入主题,就可以快速生成富有寓意的双语视频,而且是分钟级的视频。
github代码库:
https://github.com/volcengine/ai-app-lab/tree/main/demohouse/chat2cartoon
再比如「手机助手」,用户可在任意界面唤醒助手,获得日程智能管理、朋友圈文案生成等全场景服务,实现「所见即所说」的立体交互。
github代码库:
https://github.com/volcengine/ai-app-lab/tree/main/demohouse/pocket_pal
以及「视频理解」,它可以对摄像头传输的实时画面进行分析,支持高清流畅的视频通话,实现与大模型面对面的即时交流体验。无论是图表论文、人物表情、动作细节还是场景环境等,都能精准识别和理解。
github代码库:
https://github.com/volcengine/ai-app-lab/tree/main/demohouse/video_analyser
其他的,还有实时语音通话、长记忆豆包、R1联网版等应用,火山引擎都把他们放在了GitHub上,所有开发者可以部署使用。

另外,必须要给火山引擎的产品经理点个赞。他们的技术文档写得很真细,每一个开源应用,都细致入微的讲解了原理、架构、搭建步骤以及附录。

从这一点可以看出,他们是真的想教会你,去手搓出自己的应用。

写在最后
都说,2025年是AI应用大年。
以DeepSeek、豆包大模型等代表的模型为我们打好了地基,而火山引擎的“大模型应用实验室”则直接为我们盖好了房子,我们只需要去装修、入住,就可以把AI这座大house给用起来了。

这些开源的应用,企业只需要一键复制,就可以部署到自己的产品里。
值得一提的是,火山引擎本次开源的所有应用,都遵循Apache 2.0协议,也就是说你不仅可以直接使用这些代码,还可以自由修改、定制,以及商业化使用。
大模型应用实验室,集成了多模态模型和知识库、联网、文件解析等常用插件,可高效衔接多种终端和丰富的云服务,帮助开发者完成大部分AI应用的基础构建工作。
比如前面双语视频里小熊刷牙的故事,你可能觉得看起来很简单,不就是把视频模型、图片模型和语音模型TTS放在一起嘛。但真要做出这样的应用,这里面有复杂的路径和步骤。

而现在,火山引擎直接给到了所有步骤和代码,不需要企业自己去研究模型和开发流程,只需要复制粘贴,就可以完成应用开发。帮助企业大大节省了试错成本、时间成本和人力成本。
从扣子的免费模板到火山引擎的开源应用,通过开放的姿态,吸引个人爱好者、独立开发者和企业共同搭建一个繁荣且富有活力的AI生态。
这或许就是火山引擎在这轮人工智能浪潮中给出的答案,令人期待。
最后,给大家安利一下火山引擎的福利活动(阅读原文直达活动)。你只需要拿着我的邀请码(UU5A9ISJ)去注册,这样你我都能得到最高145元的代金券(3625万Tokens),够3-5人团队用上小半年的大模型API。
活动入口:
https://volcengine.com/L/RpJZpnfgkbE

(文:沃垠AI)