HLE测试归档 - 每时AI

谷歌刚刚更新！新版 Gemini 2.5 Pro：顶级推理 + 百万上下文还免费！

2025年6月6日14时作者 AI信息Gap

谷歌的Gemini 2.5 Pro又更新了，已正式在AI Studio、Vertex AI、Gemini App全面开放试用。新版本回归SOTA水平，在推理能力上表现强劲，并引入了‘思考预算’功能来控制模型推理资源消耗。

2025年4月21日14时作者 AI信息Gap

谷歌新推出Gemini 2.5 Flash，兼具性价比与性能。支持可控思考、多模态能力，并在多个基准测试中表现优异。尽管不如旗舰Pro版本，但为开发者提供了灵活选择的模型。

2025年1月25日16时作者新智元

新智元报道
编辑：KingHZ
AI模型在「人类最后一次考试」中的准确率低于10%，表现自信过度。该项目包含3000个问题，覆盖100多个学科领域。