一个使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程 上午8时 2025/03/04 作者 NLP工程化 使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程介绍分享。
刚刚,DeepSeek开源DeepEP,公开大模型训练效率暴涨秘诀! 下午12时 2025/02/25 作者 AIGC开放社区 专注AIGC领域的专业社区分享了开源的DeepEP库,用于优化混合专家模型训练和推理。DeepEP支持高效的All-to-All通信机制、高吞吐量和低延迟内核,以及原生支持FP8格式。