关于AI芯片技术的焦点问题:关于先进封装、Chiplet、CPO、液冷等

野村表示,先进封装通过Chiplet和混合键合提升性能,并向更低成本的硅桥/有机RDL及面板级封装演进。CPO虽能降低数据中心功耗,但成本和高精度组装仍是挑战。同时,两相液冷正取代传统风冷/水冷,成为解决AI加速器高功耗散热问题的关键,而芯片制造商则会根据成本与性能选择最适合的架构。

   硬·AI   

作者 | 硬 AI

      编辑 | 硬 AI

生成式AI的性能竞赛正面临三大物理瓶颈:高热量、数据传输带宽限制以及芯片尺寸(尤其是SRAM容量)的制约。

野村证券于72-15日举办了AI半导体技术专家系列研讨会,会上提出了四大关键技术发展趋势有望突破这些障碍。行业前沿的技术探索正聚焦于先进封装、光电共封装(CPO)、终端芯片架构及散热解决方案。

野村表示,先进封装技术正通过Chiplet和混合键合应对AI处理器性能提升的需求。为降低成本,2.5D封装正从硅中介层转向硅桥与有机RDL基板组合,未来有望转向面板级封装。混合键合通过提高对准精度缩小键合面积,是提升性能的关键。

下一代数据中心连接技术CPO能有效降低AI数据中心服务器的功耗,尤其适用于高带宽场景。然而,其高昂成本和高精度组装挑战仍是推广的障碍,特别是光纤与波导的微米级键合精度要求极高。在客户端设备中,半导体制造商会根据成本和性能权衡选择Chiplet或单片架构。

此外,面对AI加速器日益增长的功耗,传统的风冷和水冷逐渐失效,两相液冷因其高能效和广阔的适用范围成为未来散热的关键解决方案。

先进封装技术:布线技术是关键,混合键合前景广阔

在研讨会上,横滨国立大学的Fumihiro Inoue教授详细介绍了包括Chiplet技术在内的尖端封装技术,并讨论了未来技术路线图。

Inoue教授强调,Chiplet需要结合各种布线和键合技术,利用垂直和水平方向的先进布线技术来匹配各设备的必要规格。

目前在2.5D封装中使用的硅中介层面临成本上升问题,主要源于硅通孔(TSV)成本增加和中介层表面积扩大导致的良率下降。因此技术演进转向硅桥与有机再分布层(RDL)基板的组合方案(如CoWoS-L),使用光敏聚酰亚胺作为绝缘材料,预计2028-2029年将从晶圆工艺转向面板级封装(PLP)

混合键合技术成为提升AI处理器性能的关键解决方案,能够缩小铜元件间的键合表面积,而缩小键合表面的关键在于提高键合设备对准的精度。

CPO技术:下一代数据中心连接技术,高精度组装是挑战

日本国立产业技术综合研究所光子封装研究团队负责人Akihiro Noriki介绍了CPO的基础知识和最新发展。CPO是用于AI数据中心服务器扩展连接的下一代技术,目前由于功耗、高成本和复杂的组装技术(特别是定位)问题,仍在使用铜布线。

下一代448Gb SerDes技术的引入可能会促进CPO使用的增加。当带宽从224Gbps增加到448Gbps时,电信号可能会恶化,补偿信号劣化的复杂电路可能导致功耗增加,而CPO通过减少电信号传输距离来解决这些问题。

光纤与波导键合的难度导致CPO成本高昂且需要提高可靠性。面内键合(从波导边缘直接光耦合)需要光纤与波导之间微米级的超高精度。英特尔和Marvell似乎考虑使用V槽面内键合,而博通和英伟达似乎考虑使用基于镜面的面外键合。

客户端设备先进封装:成本约束下的最优技术选择

TechanaLye首席执行官Hiroharu Shimizu通过大量拆解照片,介绍了客户端设备等硬件中使用的处理器架构。目前几乎所有用于设备端AI和计算机视觉的处理器都配备了执行张量计算的神经处理单元(NPU)

虽然Chiplet在处理器架构中广泛使用,但Chiplet化趋势并非不可逆转。例如,AMD最新的桌面PC Radeon系列GPU将之前作为Chiplet集成在封装中的SRAM集成到GPU晶片中,采用单片架构。半导体制造商目前谨慎地根据成本和性能逐产品选择架构。

一个引人注目的例子是苹果Vision Pro中的R1视觉处理器。R1处理器使用的Chiplet封装包含两个高带宽定制DRAM芯片,分别安装在封装的顶部和底部,两个DRAM芯片都使用与R1处理器相同的I/O结构。生产针对特定应用的高性能处理器需要其他公司投入大量开发资源,这在AI加速器等高价处理器或大批量项目之外是困难的。

散热解决方案:水冷并非万能,两相液冷展现高能效优势

随着每一代AI加速器的功耗和热密度(每平方厘米的发热量)不断攀升,传统的风冷已达极限,向液冷过渡已是进行时。然而,山阳小野田市立大学的Kazuhisa Yuki教授指出,水冷并非终极答案。

水冷方案虽然散热效果好,但其泵功耗巨大,驱动泵所需的电力约与流量的立方成正比。为提升散热而提高流速,会造成功耗呈指数级增长。

一种更高效的方案是两相液冷系统。它利用高导热性液体作为制冷剂,通过液体的蒸发(气泡的形成和破裂会搅动近壁面流体)来强化散热,从而无需高功率水泵来驱动冷却介质,能效极高。

Kazuhisa Yuki教授给出了不同散热技术的适用范围:

风冷:适用于热密度10W/cm²以下的场景。

两相液冷:适用于10-100W/cm²的场景。

水冷:适用于100W/cm²以上的场景。

据估算,下一代3纳米制程的AI数据中心GPU,其热密度高达约100W/cm²,而定制化ASIC的热密度约为70-80W/cm²,后者恰好落入了两相液冷的最佳应用区间。考虑到水冷本身存在技术极限(约700W/cm²),且泵功耗问题突出,未来半导体设计必须从源头考虑降低热密度。同时,在前沿研究中,利用莲花铜lotus copper)的凹槽效应可将散热效果提升至700W/cm²以上,这代表了未来的一个重要方向。

  硬·AI   



*

(文:硬AI)

发表评论