PipelineRL:大规模异步强化学习框架 上午8时 2025/04/29 作者 NLP工程化 PipelineRL是用于大规模异步强化学习的框架,支持多GPU异步训练、实时权重更新和Redis流式数据传输,提高硬件利用率和分布式训练效率。