谷歌刚刚更新!新版 Gemini 2.5 Pro:顶级推理 + 百万上下文还免费!

谷歌的 Gemini 2.5 Pro 又更新了,就在几小时前!

Gemini 模型这更新速度没谁了,几乎是一个月一次。

上个版本,是 5 月 6 日发布的 I/O 版。

今天发布的新版 Gemini 2.5 Pro 代号 gemini-2.5-pro-preview-06-05,已正式在 AI Studio、Vertex AI、Gemini App 全面开放试用。

尽管新模型还是 Preview,但它很可能就是几周后正式发布的长期稳定版本(GA,General Availability)。

也就是说,这是谷歌接下来一段时间里押注最重的旗舰模型。



01|版本信息小抄:上线时间、上下文、接入方式

  • 版本代号gemini-2.5-pro-preview-06-05

  • 上线时间:2025 年 6 月 5 日

  • 当前阶段:Public Preview,预计数周内升级为 GA 稳定版

  • 上下文窗口

    • 输入上限:1,048,576 tokens(真 100 万)
    • 输出上限:65,536 tokens(64 K)
  • 接入方式:Google AI Studio、Vertex AI、Gemini App

  • 新增特性:支持“thinking budget”(推理预算)—— 可以控制思考成本/响应时长



02|这次真有提升?几个值得注意的性能指标

推理能力:更强了!

这版 Gemini 模型在三个极难的基准测试上表现非常强:

  • HLE(高难度智力综合测试)
  • AIDER(代码与推理基准测试)
  • GPQA(研究生难度的问答测试)

在这些近乎 “竞赛级推理” 的测试中,06-05 版 Gemini 2.5 Pro 跑赢了 o3Claude Opus 4Grok 3 以及 DeepSeek R1

用谷歌官方的话说:重回巅峰(回归 SOTA 水平)。

SOTA,“State of the Art”的缩写,意思是“当前最强水平”。

编码能力:WebDevArena 继续第一!

  • WebDevArena 榜单 Elo 分数从上一个版本的 1408 提升到了 1443,继续占据榜首。
  • AIDER Polyglot 等多语言代码基准中也稳居第一。
  • 特别适合构建 Web App、自动化 UI、写前端动效、动画播放器等。
  • 支持长代码上下文输入(100 万 tokens),能一口气跑完一整个项目文件。

响应质量:格式更整洁,回答更像“人话”

Google 官方在文档里明确提到,他们修复了 03-25 版本在非编码任务上的“回退问题”。

同时,在响应风格和结构上做了优化,回答格式更规整;更有创意。

除此之外,06-05 版本引入了一个新功能:“thinking budget”(思考预算)。

它允许你在每次使用模型时设定一个“预算范围”,来控制模型在推理阶段的资源(token)消耗。

预算越高,模型的推理就越深入全面;预算低时,它则倾向于给出更快速但可能浅显的结果。这就像给模型加了一个“思维深度的调节钮”,既照顾成本,也给用户更大灵活性。



03|怎么用?

和之前一样,新版 Gemini 2.5 Pro Preview 06-05 目前已经可以在谷歌 AI Studio 中免费体验。

百万上下文,多模态(甚至支持解析视频),顶级推理能力,再考虑到能免费用,Gemini 2.5 Pro 简直香到爆!



结语

没有过度宣传,也没有突然惊喜,谷歌 Gemini 一直是稳扎稳打、全面进化。




我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。



(文:AI信息Gap)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往