谷歌DeepMind发布AlphaEvolve,解决300年数学难题,为近40个数学问题找到更优解决方案

作者:李宝珠

编辑:耶耶

转载请联系本公众号获得授权,并标明来源


谷歌 DeepMind 公布了编程 AI Agent AlphaEvolve,可以用于通用算法发现和优化。


北京时间 5 月 14 日深夜,谷歌 DeepMind 重磅发布了一款名为 AlphaEvolve 的编程 AI Agent,其将大语言模型的强大代码生成能力与自动评估(automated evaluators)相结合,能够针对数学和现代计算中的一些基础性和复杂问题进行算法的设计与优化。


据官方介绍,AlphaEvolve 提升了谷歌数据中心、芯片设计以及 AI 训练流程的效率,还帮助设计了更快的矩阵乘法算法,并找到了一些数学开放问题的新解,展现出在多个领域广泛应用的巨大潜力。


具体而言,AlphaEvolve 利用 Gemini 系列中的多个最新大模型,其工作流程包括从语言模型生成算法代码到通过自动化评估器对这些代码进行验证和评分,最后在算法数据库中实现进化机制,不断优化生成的方案。


上图提示了采样器如何首先为语言模型构建提示,随后语言模型生成新的程序。这些程序由评估器进行评估,并存储在程序数据库中。该数据库实现了一种进化算法,用于决定哪些程序将被用于未来的提示生成


在实际应用中,AlphaEvolve 能够超越单一函数,演化出整个代码库并开发更为复杂的算法。它通过 Gemini Flash 模型拓宽解决问题的思路范围,而 Gemini Pro 模型则提供了深入的见解,两者协同工作,提出了多个计算机程序,实现了算法解决方案的编码化。该系统的工作流程包括从语言模型中自动生成新的程序,然后由评估器对其性能进行客观和量化的评估,从而筛选出最优质和高效的代码。


据官方介绍,AlphaEvolve 发现了一种简单却非常高效的启发式方法,帮助谷歌大规模集群管理系统 Borg 更高效地调度谷歌庞大的数据中心。该方案已投入生产使用超过一年,平均持续恢复 0.7% 的全球计算资源。


此外,AlphaEvolve 还提出了一种新的 Verilog 重写方法,有效去除了矩阵乘法运算电路中的不必要位数。这一改进已被整合到了谷歌即将推出的张量处理单元(TPU)中,能够提升芯片性能。


在模型训练方面,AlphaEvolve 优化了 Gemini 架构中的矩阵乘法操作,将其速度提高了 23%,缩短了 1% 的训练时间。此外,它显著减少了内核优化所需的工程时间,从几周缩短到了几天,极大地提高了研究人员的生产力。


值得一提的是,AlphaEvolve 还展示了在数学问题上的强大能力。例如,在矩阵乘法算法的发现上,它找到了一个仅需 48 次标量乘法即可完成 4×4 复数矩阵乘法的新算法,优于 Strassen 在 1969 年提出的旧算法。同时,AlphaEvolve 还应用于超过 50 个数学领域的开放问题,并在近 75% 的案例中重新发现了最先进的解决方案,而在 20% 的案例中,它更是改进了已知的最佳方案,如提高了「亲吻数问题(kissing number problem)」的解决效率,这是一个困扰数学家超 300 年的难题。


总结来看,AlphaEvolve 的应用范围广泛,不仅限于数学和计算领域。未来,谷歌计划与 People + AI Research 团队合作,开发友好用户界面,并通过 Early Access Program 向学术用户开放。长远来看,AlphaEvolve 的潜力在于它可以应用于任何可以通过算法描述并自动验证的问题,有望在材料科学、药物发现、可持续性等领域取得更多突破。


 往期推荐 


“阅读原文”,免费获取海量数据集资源!

(文:HyperAI超神经)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往