OpenAI图像生成API上线！最贵1.4元生成一张图

作者｜沐风

来源｜AI先锋官

就在昨天晚间，OpenAI也终于把GPT-4o的生图的API发布了，新模型名为“GPT-image-1”。

此前，GPT-4o的生图功能一经上线就火遍全球，据OpenAI表示，在首周，全球就有1.3亿用户用创作了超7亿张图片。

在此次开源的新模型GPT-image-1中，与GPT-4o相关的功能又有两个：

生成（Generations）：根据文本提示从头开始生成图像；

编辑（Edits）：使用新提示词部分或全部修改现有图像。

与GPT-4o图像生成不同的是，GPT-image-1支持指定图像质量、大小、格式、压缩以及是否需要透明背景来自定义输出。

其中图像质量包括：low、medium、high；

图像大小包括：1024×1024、1536×1024、1024×1536；

图像输出格式包括：PNG、JPEG、WebP，模型默认输出PNG图像，JPEG和WebP格式的压缩级别（0-100%）。

另外，基于GPT-4o强大的语义处理能力，它不仅能结合世界知识进行连续对话、迭代创作，还能确保生成图像与提示词高度一致、创作多种风格图片。

接下来，小编带大家通过OpenAI官方放出的示例来直观的了解一下GPT-image-1吧。

生成图像

下面是一个用Python 快速生成图片并保存的完整示例：

默认情况下，API返回一张图片，但可通过设置参数n，让其一次生成多张图像。

生成的图片如下：

编辑图像

通过图像编辑端点，你可以直接编辑现有图片或上传一张参考图用来生成新图像，再或者上传一张图像加蒙版，精准替换特定区域，即inpainting。

例如，上传4张图片，然后让它生成礼品篮的新图像，其中要包含参考图像中的商品。

可以看到，它自动将参考图中的物品组合到了礼品篮中。

其Python示例如下所示：

对于inpainting，你需要提供一个蒙版来指示应该编辑图像的哪些地方。

蒙版中的透明区域将被替换，而其他区域保持不变。

不过，你也可以使用提示词来描述完整的新图像，而不仅仅是蒙板区域。

如果你上传了多个图像，则蒙版将应用于第一个图像。

需要注意的是，图像和蒙版需要具有相同的格式和尺寸，大小不能超过25MB，并且蒙版图像还必须包含Alpha通道。

其Python示例如下所示：

接下来，我们来看一下GPT-image-1的API价格。

文本输入：5美元100万token；

图像输入：10美元100万token；

图像输出：40美元100万token。

按图像大小和质量估算，生成单张低、中、高质量的1024×1024图像大约花费0.02美元、0.07美元、0.19美元。

换算成人民币大约为0.1元、0.5元、1.4元。

从单价来看，确实比一些竞品要高。

最后，OpenAI也放出了许多GPT-image-1生成的图片，我们一起来看看吧。

当看到最后这两张图片时，小编不禁感慨，这提示词写的堪比一篇作文。

（文：AI先锋官）