DeepSeek AI 归档

DeepSeek开源第四弹放大招：一口气放出并行计算优化三剑客「训练速度，GPU利用，优化经验」

2025年2月27日16时作者 AI寒武纪

DeepSeek 开源周第四天推出三剑客，包括DualPipe、EPLB和profile-data项目。DualPipe优化计算与通信重叠；EPLB实现专家并行负载均衡；profile-data提供模型训练和推理的性能分析数据。

2025年2月25日16时作者 AI寒武纪

DeepSeek OpenSourceWeek 发布了首个面向MoE模型的开源EP通信库 DeepEP。它提供了高性能All-to-All通信内核、集群内和集群间全面支持，以及训练和推理预填充及推理解码低延迟内核等特性。性能测试显示其在不同场景下都能提供出色的通信性能。

2025年1月23日23时作者 NLP工程化

Math-To-Manim 是基于 DeepSeek AI 的数学动画生成器，使用 Manim 库自动化转换复杂数学概念为高质量动画。