刚刚,Gemini 2.5 Pro升级,成编程模型新王
Google DeepMind的Gemini 2.5 Pro更新提升了编程能力和多模态推理功能,可构建Web应用、游戏和模拟程序,并根据自然图像生成代码。
Google DeepMind的Gemini 2.5 Pro更新提升了编程能力和多模态推理功能,可构建Web应用、游戏和模拟程序,并根据自然图像生成代码。
近日,ICML 2025 新研究揭示大型语言模型中注意力机制的查询 (Q) 和键 (K) 表示存在极大值现象,而值 (V) 表示则没有这种模式。极大值对上下文理解至关重要,研究提出保护 Q 和 K 中的大值能有效维持模型的上下文理解能力。
OpenAI 发布公告,宣布放弃将公司完全转为营利性机构的计划,并继续由非营利组织控制。公司转型为公益公司(PBC),维持相同的使命——确保通用人工智能造福全人类。
AI模型训练中常见的两种策略——模仿学习和强化学习各有弊端。上海、西湖大学等团队提出LUFFY,结合两者优势,通过混合策略和策略塑形函数提升推理能力,实现即学即练的效果,已在GitHub开源。
研究人员提出了一种自我改进编码智能体(SICA),能够编辑自己的代码库,并在成本、速度和基准性能方面进行自我改进,该研究展示了自我参照式元智能体编程的可行性。
该研究系统地分析了大语言模型在决策场景中的表现次优原因,并提出通过强化学习对自动生成的思维链推理过程进行微调,以缓解贪婪性、频率偏差和知行差距问题。