一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元 2025年8月2日12时 作者 机器之心 Deep Cogito发布四款混合推理模型,包括4050亿参数稠密模型和6710亿MoE模型,展示迭代蒸馏与增强技术,训练成本不到350万美元。