一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元
Deep Cogito发布四款混合推理模型,包括4050亿参数稠密模型和6710亿MoE模型,展示迭代蒸馏与增强技术,训练成本不到350万美元。
Deep Cogito发布四款混合推理模型,包括4050亿参数稠密模型和6710亿MoE模型,展示迭代蒸馏与增强技术,训练成本不到350万美元。
OpenAI再次失去关键人工智能研究人员,本月已有7名员工被Meta挖走。OpenAI首席研究官Mark Chen表示公司领导层将采取措施留住顶尖人才,并发布应对策略建议员工如何处理Meta的诱惑。