数据并行归档

SGLang Team：在 96 个 H100 GPU 上部署具有 PD 分解和大规模专家并行性的 DeepSeek

2025年5月6日19时作者 GiantPandaCV

25-05-05-large-scale-ep
DeepSeek 是一个广受欢迎的开源大型语言模型

2025年3月5日14时作者 GiantPandaCV

在所有机器之间进行权重、梯度和数据的通信与同步。有一组分布式模式可以实现这一点，称为*
集体操作 C

2025年2月24日14时作者 GiantPandaCV

cale-playbook
作者：nanotron
校正：pprp
Sequence Paralle

2025年2月14日14时作者 GiantPandaCV

lgorithm-in-cuda 。
这里简要解析了一下SGLang v0.4版本中针对DeepSe

2025年1月22日23时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨猛猿
来源丨大猿搬砖简记
编辑丨极市平台
极市导读
本文深入剖析