刚刚OpenAI 正式在 ChatGPT 中推出了原生 GPT-4o 图像生成功能！

Sam Altman（OpenAI CEO）也对此发表了看法，总结下来有两点核心：

技术惊艳： Altman 表示，这项技术和产品本身极其出色。他回忆第一次看到模型生成的图片时，简直难以相信那是 AI 的手笔

创作自由与边界探索： 这次更新代表了 OpenAI 在赋予用户创作自由度方面的新高度。OpenAI 的目标是：工具本身不主动生成冒犯性内容，但如果你有此意图（在合理范围内），它会执行。他们认为，将这种智力上的自由和控制权交给用户是正确的方向

GPT-4o 图像生成的核心优势：

根据官方介绍，这次的图像生成能力有几大亮点：

1. 上下文理解与一致性： GPT-4o 能够理解并利用聊天中的图像和文本上下文，确保生成图像的连贯性和一致性
2. 复杂指令遵循： 能精确理解并执行复杂的提示词，对细节有很好的把控
3. 文本与图像的融合： 4o 擅长将文字精准地融入图像中，让图像生成成为一种强大的视觉沟通工具（比如在图片上准确生成你想要的文字）
4. 聊天式交互： 创建和定制图像就像聊天一样简单。直接告诉 GPT-4o 你想要什么，包括具体的宽高比、使用十六进制颜色代码指定颜色，或者要求透明背景等
5. 风格多样性： 支持创建各种风格的图像，也能将现有图像转换为不同风格

推送

推送范围： 今天开始，将逐步向 ChatGPT 和 Sora 的 Plus、Pro、Team 用户以及免费用户推送！是的，免费用户也能用！

后续计划： 企业版（Enterprise）、教育版（Edu）以及使用 API 的开发者也将很快获得此功能。

GPT-4o 的原生图像生成能力看起来是一次重大升级，不仅提升了图像质量和指令遵循能力，更重要的是，它深度整合在对话流程中，让 AI 生成图像变得更加自然和强大

⭐

（文：AI寒武纪）

突发！ChatGPT原生图像生成正式上线，网友：截胡谷歌Gemini 2.5发布