高吞吐量归档

扩散语言模型真的会比自回归好？理论分析结果可能恰恰相反

2025年6月10日23时作者机器之心

扩散语言模型在某些关键场景下可能不如自回归模型高效。基于理论分析和实验结果，研究提出应根据任务需求选择合适的目标衡量指标（如流畅度或序列级别准确性和逻辑正确性），从而为实践中如何使用扩散语言模型提供指导。

2025年3月4日8时作者 NLP工程化

使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程介绍分享。

2025年2月25日12时作者 AIGC开放社区

专注AIGC领域的专业社区分享了开源的DeepEP库，用于优化混合专家模型训练和推理。DeepEP支持高效的All-to-All通信机制、高吞吐量和低延迟内核，以及原生支持FP8格式。