仅用图像也能Think:Google等提出一种视觉规划的全新推理范式!
剑桥&Google提出视觉规划新范式Visual Planning,通过纯视觉表示进行规划,独立于文本。VPRL框架结合强化学习和GRPO技术优化视觉模型生成有效视觉轨迹。
谷歌发布最强 AI“全家桶”、一句话就让AI拍大片!这一夜,谷歌Gemini贯穿始终,网友:果然Android“靠边站”了
刚甩出“Windows 子系统”和“Copilot 开源”的重磅炸弹
,整个开发者圈还没从热议中缓过
刚刚,Google 眼镜「复活」了!AI 时代的涅槃
2014 年 Google Glass 发布后,Google 重新推出智能眼镜 Project Aura,采用 Gemini 技术提升视觉和语音交互能力。Project Aura 结合了 Google 和 Xreal 的技术力量,并将于 I/O 2025 上正式发布。
谷歌 Jules AI 编码助手开放 Beta!对标 Codex,网友:卷起来~
Google 推出 Jules,一个远程写代码的 AI 代理助手,定位为 OpenAI Codex 的竞争对手。Jules 能自行计划和执行任务,并能将修改后的代码变成 Pull Request 发送到 GitHub。
AI 看片写 App!Gemini 2.5 首创音视频+代码原生融合+视频理解 SOTA,构建案例来了~
Google更新了两款Gemini新模型Gemini 2.5 Pro和Gemini 2.5 Flash,在视频理解和生成方面表现突出,能生成互动应用、p5.js动画及精准描述视频片段。
碾压Cursor?谷歌突发Gemini 2.5 Pro 预览版,编码能力全网第一
谷歌发布了 Gemini 2.5 Pro Preview(I/O 版)模型,该模型在多项主流基准测试中表现优异,并可通过 Gemini API 和 Vertex AI 获取。新版本模型增强了编码和构建交互式 Web 应用的能力,在Web Arena 排行榜上名列前茅。
刚刚,Gemini 2.5 Pro升级,成编程模型新王
Google DeepMind的Gemini 2.5 Pro更新提升了编程能力和多模态推理功能,可构建Web应用、游戏和模拟程序,并根据自然图像生成代码。
谷歌再次创造历史:Gemini 2.5 Pro 通关《宝可梦:蓝》!
谷歌Gemini 2.5 Pro模型成功通关经典游戏《宝可梦:蓝》。软件工程师Joel Z搭建系统连接模拟器,通过分析内存信息自主决策玩游戏。项目强调不是基准测试,而是展示不同AI的思考方式差异。