一个模型超了DeepSeekR1、V3,参数671B,成本不到350万美元

MLNLP 社区致力于促进自然语言处理的研究与发展。Deep Cogito 提供了开源模型,通过迭代蒸馏与增强技术改进模型性能。Cogito v2 模型展示了强大的推理能力,并已在多个基准测试中优于多数开源模型。

智谱开源CogAgent AI自动屏幕操作,DeepSeek-V3低调但效果好到刷屏,AI个人简历的平台

本文介绍了5款AI模型和技术产品:CogAgent改进视觉语言模型的GUI代理;DeepSeek-V3参数量大的混合专家语言模型;Valley 2.0字节跳动开发的多模态大模型;devb.io简化生成开发者个人简历的过程;Memory Layers提供大规模分布式训练的参考实现。