突发!ChatGPT原生图像生成正式上线,网友:截胡谷歌Gemini 2.5发布


 

刚刚OpenAI 正式在 ChatGPT 中推出了原生 GPT-4o 图像生成功能

Sam Altman(OpenAI CEO)也对此发表了看法,总结下来有两点核心:

技术惊艳: Altman 表示,这项技术和产品本身极其出色。他回忆第一次看到模型生成的图片时,简直难以相信那是 AI 的手笔

创作自由与边界探索: 这次更新代表了 OpenAI 在赋予用户创作自由度方面的新高度。OpenAI 的目标是:工具本身不主动生成冒犯性内容,但如果你有此意图(在合理范围内),它会执行。他们认为,将这种智力上的自由和控制权交给用户是正确的方向

GPT-4o 图像生成的核心优势:

根据官方介绍,这次的图像生成能力有几大亮点:

  1. 1. 上下文理解与一致性: GPT-4o 能够理解并利用聊天中的图像和文本上下文,确保生成图像的连贯性和一致性

  2. 2. 复杂指令遵循: 能精确理解并执行复杂的提示词,对细节有很好的把控

  3. 3. 文本与图像的融合: 4o 擅长将文字精准地融入图像中,让图像生成成为一种强大的视觉沟通工具(比如在图片上准确生成你想要的文字)

  4. 4. 聊天式交互: 创建和定制图像就像聊天一样简单。直接告诉 GPT-4o 你想要什么,包括具体的宽高比、使用十六进制颜色代码指定颜色,或者要求透明背景

  5. 5. 风格多样性: 支持创建各种风格的图像,也能将现有图像转换为不同风格

推送

推送范围: 今天开始,将逐步向 ChatGPT 和 Sora 的 Plus、Pro、Team 用户以及免费用户推送!是的,免费用户也能用!

后续计划: 企业版(Enterprise)、教育版(Edu)以及使用 API 的开发者也将很快获得此功能。

写在最后

GPT-4o 的原生图像生成能力看起来是一次重大升级,不仅提升了图像质量和指令遵循能力,更重要的是,它深度整合在对话流程中,让 AI 生成图像变得更加自然和强大

 


(文:AI寒武纪)

发表评论