新版Gemini 2.5 pro屠榜!谷歌又把o3、Claude 4和DeepSeek-R1甩在身后了
谷歌今日突袭推出Gemini 2.5 pro的重磅更新版本Gemini 2.5 Pro Previe
谷歌今日突袭推出Gemini 2.5 pro的重磅更新版本Gemini 2.5 Pro Previe
Gemini 2.5 在 I/O 大会上展示了原生音频对话和生成能力,包括自然对话、风格控制、工具集成、多语言性等特性,提升了实时交互体验,并支持多种语音输出形式。
谷歌通过多个账号宣布Gemini 2.5 Pro新版本发布,该版本在多项任务中表现出色,并且在“人类最后的考试”数据集中的表现超越了竞争对手O3。新版Gemini还提升了Elo评分,并且在价格方面也更具优势。
谷歌发布Gemini 2.5 Pro升级版模型,优化后在多个竞技场中表现领先。新版本加入’思考预算’功能以控制成本和延迟。此外,谷歌即将推出更强的新型号Kingfall。
谷歌最新旗舰模型 Gemini 2.5 Pro 在多项关键基准测试中全面领先,拥有100万 Token 的上下文窗口和稀疏混合专家架构。然而,在开发者社区的反馈中,Gemini 被批评代码风格冗长且容易忘记上下文,而Claude Opus 4 则被认为更具优雅和简洁性。
OpenAI发布新升级功能支持企业用户通过连接器访问更多内部资源并利用实时上下文信息。这些功能包括ChatGPT接入GitHub、Outlook等平台,以及推出MCP协议和记录模式会议转录服务。
谷歌发布开源项目Gemini-fullstack-langgraph-quickstart,结合Gemini 2.5模型与LangGraph框架,展示快速构建研究型AI代理系统的方法。项目分为五步智能查询生成、网络信息搜集、反思与知识缺口分析、迭代优化搜索和综合答案生成,强调组合式AI架构、可解释性设计和实时信息整合。
DeepSeek R1-0528版本超越xAI、Meta等成为全球第二大人工智能实验室,并与谷歌并列。其智能指数得分从60分跃升至68分,超过多个顶级模型,提升主要体现在数学竞赛、代码生成和推理方面。