CUDA
AMD跑DeepSeek性能超H200!128并发Token间延迟不超50ms,吞吐量达H200五倍
AMD MI300X在FP8下全面超越英伟达H200,吞吐量最高可达H200的5倍。得益于SGLang框架和优化的AI内核库AITER,MI300X在延迟相似的情况下实现了更高的吞吐量,并且在固定并发情况下性能提升75%。
AlexNet-Source-Code:2012 年的原始 AlexNet 源代码
AlexNet-Source-Code (2012年) 在ImageNet竞赛中夺冠,推动深度学习应用,包含原始参数文件和CUDA加速训练。
Stable Virtual Camera:Stability AI 推出的 2D 图像转 3D 视频模型,一键生成沉浸式视频
新性成果,它能将
2D
图像高效转化为具备深度与透视效果的
3D
视频。
这一技术不仅为内容创作者们