Gemini 2.5 Pro
中国队重夺IMO奥数冠军,6金双满分碾压全场,AI连铜牌都拿不到
中国队在第66届国际数学奥林匹克竞赛中夺冠,总分231分全满分,创历史新高。多名选手连续两届入选国家队。IMO由全球数十个国家参与的年度赛事,旨在测试参赛者的数学知识和解题能力。
大模型IMO25数学竞赛成绩公布了
大模型在IMO数学竞赛中的表现:Gemini以超30%总成绩拔得头筹,o3和o4-mini紧随其后。MathArena对五款模型进行评估发现多数模型在几何题上得分较低,且存在格式优化过度的问题;Grok 4则因答案过于简略而受到批评。
Gemini 2.5 Pro API 免费回归!一文教你白嫖谷歌最强模型
Gemini 2.5 Pro实验版发布后备受好评,但谷歌于5月中旬关闭了免费层级的API访问通道。经过近一个月的时间,谷歌重新开放了这一功能,并提供了详细的使用指南和第三方客户端介绍。
我把这段 PUA 提示词喂给了 11 个 AI,GPT 唯唯诺诺,Claude 一身反骨,DeepSeek 幻觉起飞。
AI,人家比你新发布、比你上下文长、比你跑分高,你不努力怎么和人家比?”
我一看,这完全就是 AI
谷歌放大招了,开源命令行AI编程Agent,每天1000次免费调用,编程只是基础功能。
Gemini CLI 是谷歌推出的开源 AI 命令行工具,基于 Gemini 2.5 Pro 模型,支持百万 token 上下文,提供免费 API 请求额度,并具备智能代码处理、多模态能力、实时信息整合和高度可定制性等功能。
谷歌Gemini CLI“泄露”:AI编程的免费时代?
谷歌发布Gemini CLI开源工具,提供免费使用谷歌旗舰模型Gemini 2.5 Pro的机会,降低了顶尖AI编程工具的门槛,并可能改变现有市场格局与技术路线。
谷歌 Gemini 2.5 技术白皮书来了:顶级推理、百万上下文、多模态理解
谷歌发布Gemini 2.5系列模型,包含Pro、Flash和Flash-Lite三个版本。Pro版支持多模态输入、超长上下文处理能力;Flash版优化推理速度与成本效率;Flash-Lite版主打极低延迟和高性价比。Gemini 2.5 Pro采用稀疏激活MoE架构、大规模TPU v5p训练及强化学习控制的思维路径,显著提升性能与效率。测试显示其在编程、数学等领域能力全面提升,并具备多模态任务合成与创作输出的能力。
DeepSeek-R1编程问鼎,媲美Claude 4!2025 AI上半场战报来袭
编程新王DeepSeek-R1成功晋级,与Gemini 2.5 Pro、Claude Opus 4并列第一。AI领域进展迅速,OpenAI仍占主导地位,谷歌和Meta也有增长机会。