大规模训练归档 - 每时AI

Cosmos-RL：专为物理AI应用打造的灵活可扩展强化学习框架

2025年7月1日8时作者 NLP工程化

Cosmos-RL 是一个为物理AI应用设计的灵活可扩展强化学习框架，支持大规模训练、集成HuggingFace模型和低精度训练等特性。

图解OpenRLHF中基于Ray的分布式训练流程

2024年12月17日8时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨大猿搬砖简记
来源丨大猿搬砖简记
编辑丨极市平台
极市导读
本文