verl-pipeline:为大规模语言模型(LLM)的强化学习训练提供高效、灵活的解决方案
Agentica-project/verl-pipeline 提供高效灵活的解决方案支持高达70B参数模型和数百个GPU训练,集成多种主流LLM框架及强化学习算法。
Agentica-project/verl-pipeline 提供高效灵活的解决方案支持高达70B参数模型和数百个GPU训练,集成多种主流LLM框架及强化学习算法。
PyRoki 是一个为机器人运动优化设计的Python工具包,支持从URDF文件生成可微分的机器人运动学模型,并自动生成碰撞检测原语和集成Levenberg-Marquardt求解器以提升效率。
AGI-Alpha-Agent-v0是跨行业多Agent项目,采用MuZero技术提升决策能力,支持云原生和离线运行,涵盖金融、生物、制造等众多领域。
VITA-Audio是一款高效的语音语言模型,显著降低音频生成延迟至53毫秒,并提升推理速度3-4倍。训练数据包含20万小时音频,已开源。
Toolkami 极简AI Agent框架介绍,仅需七个工具构建强大AI Agent,支持热重载和Turbo模式。