Gemini 2.5 Pro发布,前端开发能力有巨大提升,首发根据视频做网页功能。
Gemini 2.5 Pro新发布,提升代码、前端和UI开发能力。视频转代码功能首发,自动匹配设计样式,增强了动效制作。官方提供了体验链接供用户尝试。
Gemini 2.5 Pro新发布,提升代码、前端和UI开发能力。视频转代码功能首发,自动匹配设计样式,增强了动效制作。官方提供了体验链接供用户尝试。
Google I/O开发者大会提前两周举行,推出的新版本Gemini 2.5 Pro在编程能力上大幅提升,击败了Claude 3.7和o3等模型。其功能还包括模拟物理系统、创建游戏以及生成代码块等内容。
谷歌发布了 Gemini 2.5 Pro Preview(I/O 版)模型,该模型在多项主流基准测试中表现优异,并可通过 Gemini API 和 Vertex AI 获取。新版本模型增强了编码和构建交互式 Web 应用的能力,在Web Arena 排行榜上名列前茅。
谷歌发布升级版Gemini 2.5 Pro,横扫文本、视觉和WebDev Arena基准,编程能力超越Claude 3.7。新版模型支持代码转换、编辑及复杂的AI智能体工作流,引发开发者广泛关注。
谷歌发布的Gemini 2.5 Pro I/O预览版在编码能力上显著提升,尤其在前端开发和视频内容转化方面表现突出。尽管减少API“幻觉”进步获得肯定,但AI在高级代码抽象、软件架构设计及非主流技术栈的处理仍存审慎态度。
Gemini 2.5 Pro Preview发布,具备编码、文本和视觉设计能力,超越Claude成为单一模型排行榜第一。该版本更新强化了前端Web开发和代码转换能力,并增加了视频转代码等功能。
Google DeepMind发布的Gemini 2.5 Pro在LMArena多个AI竞技场全面领先,实现文本、视觉和Web开发领域的统治地位。该版本还显著提升了代码转换、编辑能力和复杂智能体的表现,并通过Google AI Studio和Vertex AI向开发者开放。
谷歌Gemini 2.5 Pro模型成功通关经典游戏《宝可梦:蓝》。软件工程师Joel Z搭建系统连接模拟器,通过分析内存信息自主决策玩游戏。项目强调不是基准测试,而是展示不同AI的思考方式差异。
谷歌CEO劈柴哥宣布大模型Gemini成功通关《宝可梦蓝》,成为首个登顶的大型语言模型。Gemini在游戏过程中详细思考每个步骤,展示了其理解游戏的能力和局限性。
北大联合人工智能研究院等推出全新物理评测基准PHYBench,包含500道高质量物理题目,旨在评估大模型在物理感知与推理方面的表现,并通过创新的EED评分机制揭示前沿模型与人类专家之间的差距。