verl-pipeline:为大规模语言模型(LLM)的强化学习训练提供高效、灵活的解决方案 上午8时 2025/05/11 作者 NLP工程化 Agentica-project/verl-pipeline 提供高效灵活的解决方案支持高达70B参数模型和数百个GPU训练,集成多种主流LLM框架及强化学习算法。