
Flux Kontext dev实现了一句话P图自由,很快,ComfyUI又更新了原生OmniGen2 工作流。
关于 OmniGen2
OmniGen2 是一个强大且高效的统一多模态生成模型,总参数量约 7B(3B 文本模型 + 4B 图像生成模型)。与 OmniGen v1 不同,OmniGen2 采用创新的双路径 Transformer 架构,具有完全独立的文本自回归模型和图像扩散模型,实现参数解耦和专门优化。
模型亮点
- 视觉理解
:继承了 Qwen-VL-2.5 基础模型强大的图像内容解释和分析能力 - 文生图生成
:从文本提示创建高保真度和美观的图像 - 指令引导的图像编辑
:执行复杂的、基于指令的图像修改,在开源模型中达到最先进的性能 - 上下文生成
:多功能的能力,可以处理和灵活结合多样化的输入(包括人物、参考对象和场景),产生新颖且连贯的视觉输出
技术特性
- 双路径架构
:基于 Qwen 2.5 VL(3B)文本编码器 + 独立扩散 Transformer(4B) - Omni-RoPE 位置编码
:支持多图像空间定位和身份区分 - 参数解耦设计
:避免文本生成对图像质量的负面影响 -
支持复杂的文本理解和图像理解 -
可控的图像生成和编辑 -
优秀的细节保持能力 -
统一架构支持多种图像生成任务 -
文字生成能力:可以在图像中生成清晰的文字内容
如果在加载下面的工作流文件时,你发现存在节点缺失,可能是因为以下情况:
-
你使用的 ComfyUI 版本不是最新的开发(nightly)版本。 -
你使用的 ComfyUI 版本是稳定(release)版本或桌面版(desktop)版本(不包含最新的功能更新)。 -
你使用的 ComfyUI 版本是最新的 commit 版本,但在启动过程中部分节点导入失败了。
请先确保你已经成功更新 ComfyUI 到最新的开发(nightly)版本, 请查看:如何更新 ComfyUI 部分了解如何更新 ComfyUI。
OmniGen2 模型下载
由于本文涉及不同工作流,对应的模型文件及安装位置如下,对应工作流中也已包含了模型文件下载信息:
Diffusion Models)
-
omnigen2_fp16.safetensors
VAE
-
ae.safetensors
Text Encoders)
-
qwen_2.5_vl_fp16.safetensors
文件保存位置:
Copy
Ask AI
ComfyUI/ ├── models/ │ ├── diffusion_models/ │ │ └── omnigen2_fp16.safetensors │ ├── vae/ │ │ └── ae.safetensors │ └── text_encoders/ │ └── qwen_2.5_vl_fp16.safetensors <br/>
ComfyUI OmniGen2 文生图工作流<br/>
1. 工作流文件下载(图片可直接加载工作流)
https://pan.quark.cn/s/06cce6488ac5
2. 按步骤完成工作流运行

请参照图片序号进行逐步确认,来保证对应工作流的顺利运行:
- 加载主模型
:确保 Load Diffusion Model
节点加载了omnigen2_fp16.safetensors
- 加载文本编码器
:确保 Load CLIP
节点加载了qwen_2.5_vl_fp16.safetensors
- 加载 VAE
:确保 Load VAE
节点加载了ae.safetensors
- 设置图像尺寸
:在 EmptySD3LatentImage
节点设置生成图片的尺寸(推荐 1024×1024) - 输入提示词
:
-
在第一个 CLipTextEncode
节点中输入正向提示词(想要出现在图像中的内容) -
在第二个 CLipTextEncode
节点中输入负向提示词(不想要出现在图像中的内容)
- 开始生成
:点击 Queue Prompt
按钮,或使用快捷键Ctrl(cmd) + Enter(回车)
来执行文生图 - 查看结果
:生成完成后对应的图片会自动保存到 ComfyUI/output/
目录下,你也可以在SaveImage
节点中预览
ComfyUI OmniGen2 图片编辑工作流
OmniGen2 有丰富的图像编辑能力,并且支持为图像添加文本
1. 工作流文件下载(在comfyui加载图片即可拖入工作流)
https://pan.quark.cn/s/e8a6f852d85e
下载下面的图片,我们将使用它作为输入图片。

2. 按步骤完成工作流运行

- 加载主模型
:确保 Load Diffusion Model
节点加载了omnigen2_fp16.safetensors
- 加载文本编码器
:确保 Load CLIP
节点加载了qwen_2.5_vl_fp16.safetensors
- 加载 VAE
:确保 Load VAE
节点加载了ae.safetensors
- 设置图像尺寸
:在 EmptySD3LatentImage
节点设置生成图片的尺寸(推荐 1024×1024) - 输入提示词
:
-
在第一个 CLipTextEncode
节点中输入正向提示词(想要出现在图像中的内容) -
在第二个 CLipTextEncode
节点中输入负向提示词(不想要出现在图像中的内容)
- 开始生成
:点击 Queue Prompt
按钮,或使用快捷键Ctrl(cmd) + Enter(回车)
来执行文生图 - 查看结果
:生成完成后对应的图片会自动保存到 ComfyUI/output/
目录下,你也可以在SaveImage
节点中预览
3. 工作流补充说明
-
如果你想要启用第二张图像输入 ,你可以将工作流中状态为粉紫色的节点使用快捷键 Ctrl + B 来启用对应的节点输入 -
如果你想要自定义尺寸 ,可以删除链接 EmptySD3LatentImage
节点的Get image size
节点,并输入自定义尺寸
(文:路过银河AI)