日期: 2025 年 5 月 11 日
verl-pipeline:为大规模语言模型(LLM)的强化学习训练提供高效、灵活的解决方案
Agentica-project/verl-pipeline 提供高效灵活的解决方案支持高达70B参数模型和数百个GPU训练,集成多种主流LLM框架及强化学习算法。
PyRoki:一个为机器人运动优化而生的Python工具包
PyRoki 是一个为机器人运动优化设计的Python工具包,支持从URDF文件生成可微分的机器人运动学模型,并自动生成碰撞检测原语和集成Levenberg-Marquardt求解器以提升效率。
AGI-Alpha-Agent-v0:多Agent的AGI项目,致力于从识别到执行的端到端流程
AGI-Alpha-Agent-v0是跨行业多Agent项目,采用MuZero技术提升决策能力,支持云原生和离线运行,涵盖金融、生物、制造等众多领域。
火爆全网的DeepWiki开源版来了!
OpenDeepWiki 是一个开源项目,基于 .NET 9 和 Semantic Kernel 开发,旨在帮助开发者更好地理解和使用代码库。它提供了分析代码结构、生成代码文档和知识图谱等功能,并支持 MCP(ModelContextProtocol)。