简洁高效归档 - 每时AI

DeepSick-R1：轻松复现DeepSeek-R1的高效代码库

2025年3月27日8时作者 NLP工程化

DeepSick-R1 提供简洁高效的代码库（3个核心文件，825行），利用vLLM加速生成并支持多GPU训练。

从ReFT, Kimi K1.5到DeepSeek R1，聊聊Reasoning Model的精巧实现

2025年2月14日23时作者 PaperWeekly

理模型）异常火爆，Kimi 和 DeepSeek 陆续推出自家的产品 K1.5 和 R1，效果追评甚