DeepSick-R1:轻松复现DeepSeek-R1的高效代码库 上午8时 2025/03/27 作者 NLP工程化 DeepSick-R1 提供简洁高效的代码库(3个核心文件,825行),利用vLLM加速生成并支持多GPU训练。
从ReFT, Kimi K1.5到DeepSeek R1,聊聊Reasoning Model的精巧实现 下午11时 2025/02/14 作者 PaperWeekly 理模型)异常火爆,Kimi 和 DeepSeek 陆续推出自家的产品 K1.5 和 R1,效果追评甚