DeepSeek-R2 推迟发布?一场关于性能、芯片与时机的博弈

DeepSeek-R2 模型因 CEO 对性能不满及美国出口管制影响而推迟发布,目前面临算力短缺问题。该模型原计划在 2025 年初发布,但已延期多周,团队正尝试通过国产替代和优化模型结构来重新建立发布条件。

DeepSeek上新!V3-0324编码实力大涨直逼Claude 3.7,成最强开源非推理模型

DeepSeek团队发布升级模型DeepSeek-V3-0324,该模型在代码生成方面表现出色,价格仅为Claude 3.7 Sonnet的一小部分。开发者对其响应速度和资源占用优势表示赞赏,并认为它可能成为下一代推理模型R2的基础。