OpenAI发布o3和o4-mini，全面支持图像推理

重磅消息：Sam Altman 宣布 o3 和 o4-mini 双模型同步上线！两款模型都能”思考图像”，开启 AI 视觉推理新纪元！

就在刚刚，OpenAI 创始人 Sam Altman 在社交媒体上放出重磅消息：”o3 和 o4-mini 已经发布！它们非常强大，能够使用和组合 ChatGPT 中的每一种工具，尤其是多模态理解能力特别令人印象深刻。“

一石激起千层浪！这条推文立刻引爆了整个科技圈。国内外 AI 从业者纷纷转发评论，有业内人士甚至表示：”这可能是今年 AI 领域最重要的突破之一。”

“视觉思考”：图像推理的革命

这次发布的核心亮点是什么？答案是 OpenAI 全新推出的”视觉思考”(Thinking with Images)能力。o3 和 o4-mini 都能对图像进行深度推理，不仅能”看”图像，还能基于图像进行复杂思考和推理。

o3 模型具备以下关键特性：

o4-mini 模型同样支持全面的图像推理能力：

o3 和 o4-mini 在图像处理方面都表现出色，具体体现在：

阅读手写内容，进行图像推理

阅读标志，进行图像推理

OpenAI 的这两款模型标志着 AI 视觉理解迈入了新阶段：从简单的”看见”到复杂的”思考”。它们不仅能识别图像中的内容，还能基于图像信息进行高级推理，做出复杂判断，并将视觉信息与广泛的知识库结合。

这一功能对于许多专业领域都具有革命性的意义，特别是那些高度依赖视觉信息的领域，如医疗诊断、科学研究、工程设计等。

o3 和 o4-mini 的发布标志着 AI 视觉推理能力的重大突破。无论是学术研究、专业工作还是日常应用，这些能力都将为用户提供前所未有的 AI 辅助体验。

当 AI 不仅能”看”，还能”思考”所看到的内容时，我们将看到更多令人惊叹的应用场景出现。这只是视觉 AI 的开始，未来必将更加精彩。

“AI智见录” 期待与您相遇，在这里，我们用独特视角解读 AI 世界的每一个精彩瞬间，让科技与人文在此相融。

（文：AI智见录）