一个模型超了DeepSeekR1、V3,参数671B,成本不到350万美元
MLNLP 社区致力于促进自然语言处理的研究与发展。Deep Cogito 提供了开源模型,通过迭代蒸馏与增强技术改进模型性能。Cogito v2 模型展示了强大的推理能力,并已在多个基准测试中优于多数开源模型。
MLNLP 社区致力于促进自然语言处理的研究与发展。Deep Cogito 提供了开源模型,通过迭代蒸馏与增强技术改进模型性能。Cogito v2 模型展示了强大的推理能力,并已在多个基准测试中优于多数开源模型。
Deep Cogito发布四款混合推理模型,包括4050亿参数稠密模型和6710亿MoE模型,展示迭代蒸馏与增强技术,训练成本不到350万美元。