

算力生态的竞争,本质是技术深度与人才密度的双重较量。
作者|云凡
编辑|栗子
在当前全球科技竞争日益激烈、核心技术自主创新问题凸显的背景下,算力平台的崛起与壮大,承载着国家信息产业自主可控的战略使命。
在这场攻坚战中,高校与科研机构作为重要的创新源泉,正发挥着不可替代的作用。
华南理工大学计算机科学与工程学院的教授、博导陆璐,正是一位深耕于此领域的代表。陆璐不仅拥有在证券软件开发、微软应用软件架构优化等业界积累的经验,更在回归学界后,将研究重心聚焦于软件体系架构、可靠性保障,以及尤为关键的AI算力平台性能优化。
近年来,他带领团队与昇腾开展深度合作,致力于解决平台面临的性能挑战,推动软件生态的繁荣。
本文,「甲子光年」对话陆璐,深入了解他独特的学术与职业历程、其团队在异构并行加速和算子创新方面的突破,以及他对芯片生态建设、人才培养的真知灼见,探寻国产算力迈向全球标杆的可能路径。
1.破界者之路:从行业领军到算力先锋

陆璐教授的个人经历,本身就体现了产业、学术和科研领域的有机结合。
1999年,陆璐在博士毕业后,并未直接留在学界,而是选择了投身香港的金融科技前沿。作为香港首批优才计划引进人才,他在东方汇理银行从事了两年证券软件开发工作。
随后,他进入微软公司,专注于应用软件架构优化。在微软的工作,无疑为他打开了国际视野,深入理解了大型软件系统的设计理念和性能瓶颈所在。
2005年,陆璐选择回归学术界,入职华南理工大学。
这一转变并非简单的回归,而是带着丰富的实践经验和对产业需求的深刻洞察。他在高校的教研工作,自然而然地将理论研究与产业前沿紧密结合。他的研究方向涵盖软件体系架构、软件测试、软件可靠与保障——这些都是构建复杂、稳定、高效软件系统的基石。
随着人工智能时代的到来,特别是近年来算力面临的严峻挑战,陆璐敏锐地捕捉到了新的科研制高点:在人工智能环境下的大模型算力优化和平台性能优化。
“我们团队近5年主要从事软件体系架构、软件可靠与保障设计,以及人工智能平台下性能的算力,平台的性能极致优化。”陆璐介绍道,“主要是针对国外主流厂商对我们国内算力的卡脖子,我们致力于在国内的平台上把跑不起来的应用跑起来,跑起来的应用达到更好的性能。”
这个动作背后,揭示了性能优化与生态建设之间的内在联系——只有平台性能足够优越,才能吸引并留住用户,进而繁荣软件生态,形成正向循环。这不仅是技术问题,更是事关国家计算产业发展的战略高地。
2.昇腾攻坚:性能跃迁与生态突围

陆璐团队的一个重要合作伙伴,便是昇腾。
谈及与昇腾的结缘,陆璐回忆起最初的契机:“最开始接触昇腾,是华为的技术专家到我们学院做技术交流,当时了解到,在国内也有企业做类似于像国外厂商的硬件和软件的体系架构。”然而,初步了解伴随着普遍反映的问题:“很多高校老师和研究机构都反映昇腾的平台不够亲和,用起来比较难受。”
正是这种“难受”的反馈,激发了陆璐的探索欲:“我就有了这个好奇,问题在哪里呢?”他决定亲身实践。
通过深入的编程和研究,陆璐团队发现,一旦熟悉了昇腾的编程平台,理解了其独特的硬件体系架构,它并非想象中那么难以驾驭。“经过我们的整个这样的优化,它的性能从50%提到100%,甚至在某些应用场景从200%—500%。”
性能优化的核心在于对异构并行计算的深刻理解和高效利用。
陆璐解释了他们为何专注于异构并行加速:“在一个整机平台里,不仅要考虑单纯的算力卡,还要考虑CPU以及内存带宽,三者紧密地联合在一起才能达到最佳性能。”这意味着,要实现系统整体性能的最优化,必须统筹考虑CPU、NPU以及它们与内存之间的高效通信。这种复杂的协同优化,正是异构并行加速研究的价值所在。
他们的研究成果并非停留在论文研究阶段,而是产生了实实在在的作用。
陆璐认为主要体现在两方面。首先是开源,比如近期开源的模板生态库,显著降低了开发门槛,使广大开发者能更便捷高效地利用昇腾算力,提升性能,从而繁荣了整个软件生态。
其次,通过与华为计算产品线深度合作,将自研算子和编译优化工具直接集成到其产品及基础软件库中,有效提升了基础软件的性能并丰富了其内容。
陆璐告诉「甲子光年」,看到团队的工作能够帮助华为在基础软件库层面实现性能提升和生态丰富,并最终服务于自主创新战略,这让他们感到无比的成就和自豪。
3.生态崛起:聚焦、夯基、聚才

展望算力生态的未来,陆璐的思考既有宏观的战略视野,也有微观的实操建议。
他认为,芯片生态基础建设是一个复杂且长期的过程。当前国内涌现出包括华为、寒武纪、曙光、百度昆仑芯等众多硬件厂商,虽然在种类上可能多于美国,但陆璐强调要“集中力量办大事”。在他看来,华为无疑是国内算力领域的“龙头老大”,如何做好老大的角色至关重要。
关于国产算力何时能成为全球标杆,以及达成这一目标需要做对哪些关键事情,陆璐认为,如果十年后昇腾或其他平台能够达到被模仿、成为标杆的程度,最关键的是做对了以下三件事。
首先,夯实基础算子库。
任何高性能的大模型应用都离不开底层算子的强大支撑。只有将最底层的算子库做得扎实,达到最优性能和最高精度,这才是整个计算平台的基石。
其次,高效建设算子模板库。
在基础算子库之上,构建高效的算子模板库,能够大大简化应用层开发者的工作。通过更少的代码实现更高的性能和效率,从而吸引并留住更多用户。
最后,优化AI编译器。
基于MLIR等开源编译器进行深度优化,简化各种应用的编译过程,确保其能在目标硬件上高效运行。陆璐强调,这三点是提升昇腾平台易用性、功能强大性、黏住用户并最终实现引领的关键。
此外,生态建设离不开人才支撑。陆璐认为,要构建强大的人才洪流,核心在于实现硬件可得、软件会用、知识普及。这三点对于人才培养至关重要,它能汇聚涓涓细流,最终形成人才的洪流,为算力迈向未来奠定坚实的人才基础。
算力生态的竞争,本质是技术深度与人才密度的双重较量。
唯有将“硬核技术突破”与“柔性人才培育”深度融合,才能实现从单点创新到系统领先的跨越。当国产算力平台既能提供媲美顶尖硬件的性能,又能汇聚全球开发者的智慧时,中国不仅将在算力领域树立标杆,更将重塑AI时代的创新版图——这既是昇腾的使命,更是中国科技自立自强的必由之路。

(文:甲子光年)