重磅!谷歌DeepMind发布AlphaEvolve:AI界的“算法设计进化大师”诞生

谷歌DeepMind发布AlphaEvolve智能体,通过自动化考官系统优化算法并应用于多个核心业务中,包括数据中心调度、芯片设计及AI训练提速等。此外,AlphaEvolve还在数学算法发现上取得突破。

特斯拉擎天柱机器人最新进展:“零样本”魔性舞蹈秀翻全场,全靠模拟器苦练?

特斯拉展示了擎天柱机器人通过强化学习在模拟环境中训练并实现‘零样本迁移’的最新成果。这次演示展示了机器人能够在真实世界中成功执行复杂动作,省去了大量调试时间和成本。

未来已来?看陶哲轩如何“蒙眼狂奔”,33分钟让AI完成高难度数学形式化证明

陶哲轩分享了利用GitHub Copilot与Lean结合canonical策略的形式化数学证明实验,该实验针对Bruno Le Floch提供的一页纸等式理论证明。陶神尝试以低级别逐行方式形式化一个高度精确的“体力活”证明,并总结为AI辅助下的新范式。

17000字Claude 系统提示启示:Karpathy 揭秘LLM 学习缺失“第三范式”

Andrej Karpathy提出LLM学习中缺失的环节是’系统提示词学习’。他认为人类的学习更多是通过明确的语言记住解决问题的方法,而非零散的记忆。Karpathy还分析了Claude系统的惊人提示词内容及其潜在应用价值。

OpenAI强化微调终于上线了:几十个样本就可轻松打造AI专家

OpenAI正式推出强化微调(RFT),通过思维链推理和任务专属评分机制提升模型特定领域的性能。目前已开放给经过验证的组织使用,并提供折扣优惠和指南。RFT适用于需要正确且可验证决策的工作流,已在芯片设计、医疗编码分配及税务分析等多个领域展示出色效果。

OpenAI迎来新帅,Instacart CEO 空降执掌应用部门,奥特曼将专注三大支柱

OpenAI CEO Sam Altman宣布Instacart CEO Fidji Simo加入OpenAI担任应用部门CEO。Fidji Simo此前是OpenAI董事会成员,她将负责领导新整合的应用部门,加速技术的产品化、规模化和商业化进程。