Hybrid MoE 3.0 归档

DeepSeek R2 参数被“意外”泄漏

2025年4月29日8时作者 PyTorch研习社

DeepSeek R2参数量高达1.2万亿，采用Hybrid MoE 3.0架构，在保持模型能力的同时实现了计算资源的极致压缩，并引入了专门针对法律文书分析的新模块。其多模态精度达到92.4%，误报率低，部署优势明显，支持国产芯片优化，预计未来将减少对西方依赖。

2025年4月27日23时作者 AGI Hunt

DeepSeek R2参数达到1.2万亿，采用Hybrid MoE 3.0架构，并在成本上大幅下降。其多模态能力出色，视觉理解和工业质检表现优异，8bit量化压缩后仍保持较高精度。