Open-R1 归档 - 每时AI

Open R1 项目进展第二期

2025年4月1日14时作者 Hugging Face

把 DeepSeek R1 缺失的部分补齐，特别是训练流程和合成数据。
https://github

Open R1 项目进展第一期

2025年3月28日14时作者 Hugging Face

和合成数据——也才过了一周。这篇文章简单聊聊:
https://github.com/hugging

X-R1：人人都能复现0.5B Aha Moment

2025年2月13日8时作者 NLP工程化

X-R1 提出了一种低成本、易于使用的强化学习训练框架，成功训练出0.5B参数的R1-Zero模型。