DeepSeek V3论文细节:如何绕开CUDA的垄断! 下午10时 2025/01/29 作者 Datawhale DeepSeek 使用英伟达 PTX 编程技术,在硬件受限条件下训练出高性能语言模型,展示了在减少对算力需求的同时提升性能的可能。
国产AI之光,正在超越ChatGPT! 下午4时 2024/12/28 作者 路过银河AI DeepSeek V3发布技术报告,其高效能和低算力依赖使其成为当前最强开源基础模型。预训练阶段成本仅为557万美元,性能对标GPT-4o及Claude-3.5-Sonnet。