谷歌的 Gemini 2.5 Pro
又更新了,就在几小时前!
Gemini 模型这更新速度没谁了,几乎是一个月一次。
上个版本,是 5 月 6 日发布的 I/O 版。
今天发布的新版 Gemini 2.5 Pro
代号 gemini-2.5-pro-preview-06-05
,已正式在 AI Studio、Vertex AI、Gemini App 全面开放试用。

尽管新模型还是 Preview,但它很可能就是几周后正式发布的长期稳定版本(GA,General Availability)。
也就是说,这是谷歌接下来一段时间里押注最重的旗舰模型。
01|版本信息小抄:上线时间、上下文、接入方式
-
版本代号:
gemini-2.5-pro-preview-06-05
-
上线时间:2025 年 6 月 5 日
-
当前阶段:Public Preview,预计数周内升级为 GA 稳定版
-
上下文窗口:
-
输入上限:1,048,576 tokens(真 100 万) -
输出上限:65,536 tokens(64 K) -
接入方式:Google AI Studio、Vertex AI、Gemini App
-
新增特性:支持“thinking budget”(推理预算)—— 可以控制思考成本/响应时长

02|这次真有提升?几个值得注意的性能指标
推理能力:更强了!
这版 Gemini 模型在三个极难的基准测试上表现非常强:
-
HLE(高难度智力综合测试) -
AIDER(代码与推理基准测试) -
GPQA(研究生难度的问答测试)
在这些近乎 “竞赛级推理” 的测试中,06-05
版 Gemini 2.5 Pro
跑赢了 o3
、Claude Opus 4
、Grok 3
以及 DeepSeek R1
。
用谷歌官方的话说:重回巅峰(回归 SOTA 水平)。
SOTA,“State of the Art”的缩写,意思是“当前最强水平”。

编码能力:WebDevArena 继续第一!
-
WebDevArena 榜单 Elo 分数从上一个版本的 1408 提升到了 1443,继续占据榜首。 -
AIDER Polyglot 等多语言代码基准中也稳居第一。 -
特别适合构建 Web App、自动化 UI、写前端动效、动画播放器等。 -
支持长代码上下文输入(100 万 tokens),能一口气跑完一整个项目文件。

响应质量:格式更整洁,回答更像“人话”
Google 官方在文档里明确提到,他们修复了 03-25
版本在非编码任务上的“回退问题”。
同时,在响应风格和结构上做了优化,回答格式更规整;更有创意。
除此之外,06-05
版本引入了一个新功能:“thinking budget”(思考预算)。
它允许你在每次使用模型时设定一个“预算范围”,来控制模型在推理阶段的资源(token)消耗。
预算越高,模型的推理就越深入全面;预算低时,它则倾向于给出更快速但可能浅显的结果。这就像给模型加了一个“思维深度的调节钮”,既照顾成本,也给用户更大灵活性。

03|怎么用?
和之前一样,新版 Gemini 2.5 Pro Preview 06-05
目前已经可以在谷歌 AI Studio 中免费体验。
百万上下文,多模态(甚至支持解析视频),顶级推理能力,再考虑到能免费用,Gemini 2.5 Pro
简直香到爆!

结语
没有过度宣传,也没有突然惊喜,谷歌 Gemini 一直是稳扎稳打、全面进化。
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。
(文:AI信息Gap)