Llama 4 发布:我看到了 DeepSeek 的影子 2025年4月6日14时 作者 赛博禅心 Llama 4 发布三款模型:Scout、Maverick 和 Behemoth。参数量分别为109B、400B和2T;Maverick 在多项任务上超越GPT-4,并且推理成本仅为其十分之一。
从啥也不会到DeepSpeed——一篇大模型分布式训练的学习过程总结 2024年12月15日14时2024年11月22日23时 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨elihe@知乎(已授权) 来源丨https://zhuanla