

6月26日,有细心的网友发现,AI圈学术大神何恺明的个人履历主页更新了,除了麻省理工学院(MIT)电子工程与计算机科学系终身副教授身份外,他还兼职担任起谷歌DeepMind的杰出科学家。
何恺明的主要研究领域为计算机视觉和深度学习,是深度残差网络(ResNets)的主要发明者,该研究使得神经网络达到了前所未有的深度。
据《自然》杂志在今年5月发布的一项分析报告显示,21世纪截至目前被引用次数最多的论文便是ResNets的报告,该成果自2015年提出后被广泛应用于现代深度学习模型中,包括Transformer模型(如ChatGPT)、AlphaGoZero、AlphaFold以及当今几乎所有GenAI模型等。
谷歌学术数据显示,截至目前何恺明参与的研究论文被引用总量超过71万次,多项研究得到国际AI顶会荣誉,如2009年CVPR、2016年CVPR、2017年ICCV最佳论文奖、2018年ECCV、2021年CVPR最佳论文荣誉奖和2021年ICCV Everingham奖等。
随着顶尖人才加盟,谷歌在AI战场的领先地位变得越来越牢固了。

何恺明被外界视为“天才型”人物。他1984年生于广州,2003年拿下广东省高考状元,2003-2007年就读于清华大学物理系基础科学班,本科毕业后去香港中文大学读研,师从计算机人工智能科学家汤晓鸥。
2009年,何恺明的一篇论文获得CVPR年度最佳论文奖,成为CVPR创办25年以来的首位华人获奖者。2015年,何恺明和团队凭借152层深度残差网络ResNet-152,在ImageNet图像识别大赛中击败谷歌获得第一,一战名震AI江湖。
他在产业界的履历也很有含金量,牵手谷歌DeepMind之前,他于2011年至2016年间在微软亚洲研究院(MSRA)担任研究员,2016年至2024年在Facebook(现Meta)人工智能研究中心(FAIR)担任研究科学家。
2024年2月,他加入麻省理工学院电气工程与计算机科学系(MIT EECS)担任副教授,2025年6月刚获得MIT终身教职身份。
而且,何恺明还是一位很“高产”的学者,公开信息显示,在2025年前6个月他参与的论文量就有7篇。2025年3月份,何恺明和“卷积网络之父”、图灵奖得主Yann LeCun在一篇论文里提出“无需归一化的Transformer”得到广泛关注。
今年上半年,何恺明的其他研究还涉及图像生成、生成建模、生成模型去噪、高度压缩的标记器、分形生成模型等等。

相比较OpenAI近几年面临的人才流失问题,Meta团队不给力被迫重金重组,谷歌DeepMind对于顶尖AI人才的吸引力相对更强,这也反哺出了更领先的AI模型和产品,进一步强化了在AI赛道中的竞争优势。
目前来看,谷歌DeepMind正向着3大AI技术方向迅猛进击:
1、具身智能机器人技术。今年2月份,谷歌作为投资者参与了Apptronik的3.5亿美元A轮融资,DeepMind与Apptronik建立了技术战略合作关系,围绕Apollo人形机器人进行市场布局,近期,加码具身智能VLA系列模型Gemini Robotics的创新得到行业关注。
2、AGI和多模态大模型。Gemini 2.5 Pro作为谷歌在2025年推出的旗舰AI模型,在多项关键领域实现对GPT、Claude最新模型的性能赶超,2025年5月升级版霸占了LMArena文本、视觉、WebDev三领域榜首,根据2025年5月Poe平台最新报告,Gemini 2.5 Pro在推理模型市场份额达31.5%,此外,旗下Veo3视频生成模型、Imagen4图像生成模型等也在市场应用中处于强势地位。
3、AI驱动数学与科研。今年2月份,AlphaGeometry2问世,解决过去25年国际数学奥林匹克(IMO)84%的几何问题,超越金牌选手平均水平;5月,DeepMind与华裔数学家陶哲轩等一众顶尖学者合作打造出AlphaEvolve通用科学智能体,帮助科学家攻克了300年未解的数学难题,刷新矩阵乘法纪录。
今天,DeepMind又新推出一个DNA序列模型AlphaGenome,帮助科学家更好地理解基因组,可能会给生命医学研究带来新的突破。
例如疾病理解,通过更准确地预测基因突变,AlphaGenome可以帮助研究人员更精准地查明疾病的潜在病因,解释与某些性状相关的变异的功能影响,从而可能发现新的治疗靶点;合成生物学,它的预测可用于指导具有特定调节功能的合成DNA的设计。
值得关注的是,这项最新研究成果背后,也有着华人科学家一作的身影。
何恺明在当前这个阶段加入谷歌阵营算是锦上添花,业内分析认为,一方面,这将近一步增强DeepMind对全球AI精英人才的吸引力,另一方面,便是推动谷歌下一代模型的技术创新和突破。
加入DeepMind后,何恺明或将推动残差结构在多模态大模型中的深度优化,解决长序列建模中的梯度衰减问题。此外,他的研究正在探索生成模型的范式突破,例如其近期提出的分形生成模型将计算效率提升4000倍,实现逐像素生成高分辨率图像,而提出的MeanFlow框架则实现单步图像生成,挑战扩散模型逐步生成的方法,这些技术有望整合至Gemini下一代架构,大幅改进图像/视频生成效率。
此外,业界当下正在积极推动AI从数字世界向物理世界迈进,何恺明在Mask R-CNN(实例分割)、MoCo(自监督学习)等领域的创新,将补强DeepMind在多模态对齐与具身智能的短板,或助力Gemini Robotics进化。
另外,他主张生成模型应像AlexNet后的识别模型一样实现端到端训练,而非依赖逐步生成,这一理念若与DeepMind的AlphaEvolve(自主进化算法)结合,可能催生更高效的AGI训练范式。

以何恺明为代表的华人科学家和研究人员,目前在全球AI大潮中发挥着举足轻重的影响力。
据智库平台MacroPolo发布的《全球人工智能人才追踪》报告,2024年美国AI顶尖机构中,关键项目团队的华人占比达27%-40%。
如OpenAI的GPT-4o团队,17名核心成员中6人为华人,马斯克宣布xAI创始团队时,12人中5人为华人,谷歌Gemini项目技术报告837位作者中,据统计包含140余位华人研究员。

今年的ICLR2025杰出论文奖,三篇论文均为华人一作,包括OpenAI研究员漆翔宇、不列颠哥伦比亚大学Yi Ren以及新国立的Junfeng Fang和中科大Houcheng Jiang等。
AAAI Fellow被誉为国际AI领域的名人堂,2025 AAAI Fellow全球16位入选AI学者中就有4位华人学者,包括陈一昕、付昀、熊辉、杨明玄等。
有趣的是在AI算力层面,英特尔的新CEO陈立武、英伟达创始人兼CEO黄仁勋、AMD董事长兼CEO苏姿丰和博通CEO陈福阳等也是一个华人或华裔掌舵的阵容,黄仁勋在Computex 2025期间公开强调:“全球顶尖AI研究人员中有一半都是中国人”,呼吁美国要正视华人贡献。
有网友调侃“美国AI华人造”,从算法创新到AGI探索,从前沿实验室到产业突围,华人科学家们正以独特的角色重塑着全球AI权力图谱,这一影响力在未来可能会越来越大。
-END-

(文:头部科技)