作者|沐风
来源|AI先锋官
就在昨天晚间,OpenAI也终于把GPT-4o的生图的API发布了,新模型名为“GPT-image-1”。
此前,GPT-4o的生图功能一经上线就火遍全球,据OpenAI表示,在首周,全球就有1.3亿用户用创作了超7亿张图片。
在此次开源的新模型GPT-image-1中,与GPT-4o相关的功能又有两个:
生成(Generations):根据文本提示从头开始生成图像;
编辑(Edits):使用新提示词部分或全部修改现有图像。
与GPT-4o图像生成不同的是,GPT-image-1支持指定图像质量、大小、格式、压缩以及是否需要透明背景来自定义输出。
其中图像质量包括:low、medium、high;
图像大小包括:1024×1024、1536×1024、1024×1536;
图像输出格式包括:PNG、JPEG、WebP,模型默认输出PNG图像,JPEG和WebP格式的压缩级别 (0-100%)。
另外,基于GPT-4o强大的语义处理能力,它不仅能结合世界知识进行连续对话、迭代创作,还能确保生成图像与提示词高度一致、创作多种风格图片。
接下来,小编带大家通过OpenAI官方放出的示例来直观的了解一下GPT-image-1吧。
生成图像
下面是一个用Python 快速生成图片并保存的完整示例:

默认情况下,API返回一张图片,但可通过设置参数n,让其一次生成多张图像。
生成的图片如下:

编辑图像
通过图像编辑端点,你可以直接编辑现有图片或上传一张参考图用来生成新图像,再或者上传一张图像加蒙版,精准替换特定区域,即inpainting。
例如,上传4张图片,然后让它生成礼品篮的新图像,其中要包含参考图像中的商品。

可以看到,它自动将参考图中的物品组合到了礼品篮中。
其Python示例如下所示:

对于inpainting,你需要提供一个蒙版来指示应该编辑图像的哪些地方。

蒙版中的透明区域将被替换,而其他区域保持不变。
不过,你也可以使用提示词来描述完整的新图像,而不仅仅是蒙板区域。
如果你上传了多个图像,则蒙版将应用于第一个图像。
需要注意的是,图像和蒙版需要具有相同的格式和尺寸,大小不能超过25MB,并且蒙版图像还必须包含Alpha通道。
其Python示例如下所示:

接下来,我们来看一下GPT-image-1的API价格。
文本输入:5美元100万token;

图像输入:10美元100万token;
图像输出:40美元100万token。
按图像大小和质量估算,生成单张低、中、高质量的1024×1024图像大约花费0.02美元、0.07美元、0.19美元。

换算成人民币大约为0.1元、0.5元、1.4元。
从单价来看,确实比一些竞品要高。
最后,OpenAI也放出了许多GPT-image-1生成的图片,我们一起来看看吧。











当看到最后这两张图片时,小编不禁感慨,这提示词写的堪比一篇作文。
(文:AI先锋官)