PyTorch
PyTorch灵魂人物出走,被Ilya奥特曼抢破头!放弃大厂offer,却选择了ChatGPT之母
离职加入OpenAI前CTO初创Thinking Machines。这位技术奇才,曾被OpenAI、
刚刚!DeepSeek开源FlashMLA,推理加速核心技术
DeepSeek本周开源了一款用于Hopper GPU的高效MLA解码内核FlashMLA,主要用于减少推理过程中的KV Cache成本。该项目上线45分钟后收获超过400星,并且得到了广泛好评。
RTX 4090单卡跑满血版DeepSeek-R1?清华&趋境科技联合推出KTransformers方案!
清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型,包括环境搭建、模型加载及推理参数设置等步骤。