一句话P图：ComfyUI OmniGen2 原生工作流

Flux Kontext dev实现了一句话P图自由，很快，ComfyUI又更新了原生OmniGen2 工作流。

关于 OmniGen2
OmniGen2 是一个强大且高效的统一多模态生成模型，总参数量约 7B（3B 文本模型 + 4B 图像生成模型）。与 OmniGen v1 不同，OmniGen2 采用创新的双路径 Transformer 架构，具有完全独立的文本自回归模型和图像扩散模型，实现参数解耦和专门优化。

模型亮点

视觉理解

：继承了 Qwen-VL-2.5 基础模型强大的图像内容解释和分析能力
文生图生成

：从文本提示创建高保真度和美观的图像
指令引导的图像编辑

：执行复杂的、基于指令的图像修改，在开源模型中达到最先进的性能
上下文生成

：多功能的能力，可以处理和灵活结合多样化的输入（包括人物、参考对象和场景），产生新颖且连贯的视觉输出

技术特性

双路径架构

：基于 Qwen 2.5 VL（3B）文本编码器 + 独立扩散 Transformer（4B）
Omni-RoPE 位置编码

：支持多图像空间定位和身份区分
参数解耦设计

：避免文本生成对图像质量的负面影响
支持复杂的文本理解和图像理解
可控的图像生成和编辑
优秀的细节保持能力
统一架构支持多种图像生成任务
文字生成能力：可以在图像中生成清晰的文字内容

如果在加载下面的工作流文件时，你发现存在节点缺失，可能是因为以下情况：

你使用的 ComfyUI 版本不是最新的开发（nightly）版本。
你使用的 ComfyUI 版本是稳定（release）版本或桌面版（desktop）版本（不包含最新的功能更新）。
你使用的 ComfyUI 版本是最新的 commit 版本，但在启动过程中部分节点导入失败了。

请先确保你已经成功更新 ComfyUI 到最新的开发（nightly）版本, 请查看：如何更新 ComfyUI 部分了解如何更新 ComfyUI。

OmniGen2 模型下载
由于本文涉及不同工作流，对应的模型文件及安装位置如下，对应工作流中也已包含了模型文件下载信息：
Diffusion Models）

omnigen2_fp16.safetensors

VAE

ae.safetensors

Text Encoders）

qwen_2.5_vl_fp16.safetensors

文件保存位置：
Copy
Ask AI
ComfyUI/ ├── models/ │ ├── diffusion_models/ │ │ └── omnigen2_fp16.safetensors │ ├── vae/ │ │ └── ae.safetensors │ └── text_encoders/ │ └── qwen_2.5_vl_fp16.safetensors <br/>
ComfyUI OmniGen2 文生图工作流<br/>
1. 工作流文件下载（图片可直接加载工作流）

https://pan.quark.cn/s/06cce6488ac5

2. 按步骤完成工作流运行

请参照图片序号进行逐步确认，来保证对应工作流的顺利运行：

加载主模型

：确保 Load Diffusion Model 节点加载了 omnigen2_fp16.safetensors
加载文本编码器

：确保 Load CLIP 节点加载了 qwen_2.5_vl_fp16.safetensors
加载 VAE

：确保 Load VAE 节点加载了 ae.safetensors
设置图像尺寸

：在 EmptySD3LatentImage 节点设置生成图片的尺寸（推荐 1024×1024）
输入提示词

：

在第一个 CLipTextEncode 节点中输入正向提示词（想要出现在图像中的内容）
在第二个 CLipTextEncode 节点中输入负向提示词（不想要出现在图像中的内容）

开始生成

：点击 Queue Prompt 按钮，或使用快捷键 Ctrl(cmd) + Enter(回车) 来执行文生图
查看结果

：生成完成后对应的图片会自动保存到 ComfyUI/output/ 目录下，你也可以在 SaveImage 节点中预览

ComfyUI OmniGen2 图片编辑工作流
OmniGen2 有丰富的图像编辑能力，并且支持为图像添加文本

1. 工作流文件下载（在comfyui加载图片即可拖入工作流）

https://pan.quark.cn/s/e8a6f852d85e

下载下面的图片，我们将使用它作为输入图片。

2. 按步骤完成工作流运行

加载主模型

：确保 Load Diffusion Model 节点加载了 omnigen2_fp16.safetensors
加载文本编码器

：确保 Load CLIP 节点加载了 qwen_2.5_vl_fp16.safetensors
加载 VAE

：确保 Load VAE 节点加载了 ae.safetensors
设置图像尺寸

：在 EmptySD3LatentImage 节点设置生成图片的尺寸（推荐 1024×1024）
输入提示词

：

在第一个 CLipTextEncode 节点中输入正向提示词（想要出现在图像中的内容）
在第二个 CLipTextEncode 节点中输入负向提示词（不想要出现在图像中的内容）

开始生成

：点击 Queue Prompt 按钮，或使用快捷键 Ctrl(cmd) + Enter(回车) 来执行文生图
查看结果

：生成完成后对应的图片会自动保存到 ComfyUI/output/ 目录下，你也可以在 SaveImage 节点中预览

3. 工作流补充说明

如果你想要启用第二张图像输入，你可以将工作流中状态为粉紫色的节点使用快捷键 Ctrl + B 来启用对应的节点输入
如果你想要自定义尺寸，可以删除链接 EmptySD3LatentImage 节点的 Get image size 节点，并输入自定义尺寸

（文：路过银河AI）

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

发表评论 取消回复

发表评论取消回复