微软急刹车,被曝撤掉大波数据中心租赁!DeepSeek冲击,算力泡沫要破?
DeepSeek开源引发微软大规模租赁取消,微软正放缓数据中心投资。OpenAI从微软转向甲骨文合作,微软考虑是否过度建设AI算力。
DeepSeek开源引发微软大规模租赁取消,微软正放缓数据中心投资。OpenAI从微软转向甲骨文合作,微软考虑是否过度建设AI算力。
网友:突破AI基础设施极限。DeepSeek发布首个用于MoE模型训练和推理的开源EP通信库,支持NVLink和RDMA等硬件,提供高吞吐量且低延迟的全对全GPU内核,加速大规模MoE模型任务。
DeepSeek开源第二弹来了!首个用于MoE模型训练和推理的开源EP通信库DeepEP提供高吞吐量和低延迟的all-to-all GPU内核,支持低精度运算包括FP8。性能方面涵盖高效和优化的all-to-all通信、NVLink和RDMA的支持、预填充任务和推理解码任务等。团队建议使用Hopper GPUs及更高版本Python 3.8及以上CUDA 12.3及以上PyTorch 2.1及以上环境,并提供详细的使用指南。
阿里通义千问团队推出QwQ-Max-Preview深度思考模型,支持联网搜索,并展示了其在电影评论、代码编写、数学题解答以及游戏开发等方面的超强能力。
阿里通义Qwen团队发布Max旗舰版,排名第五的预览版已在LiveCodeBench编程测试中。展示了数学、编程和Agent相关任务的能力,并计划以Apache2.0许可协议开源。公告还透露将发布独立于通义千问APP的Qwen Chat APP,附有8段演示视频展示其能力。
专注AIGC领域的专业社区分享了开源的DeepEP库,用于优化混合专家模型训练和推理。DeepEP支持高效的All-to-All通信机制、高吞吐量和低延迟内核,以及原生支持FP8格式。