DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路 下午4时 2025/03/09 作者 量子位 elScope魔搭社区。 随着DeepSeek-R1的成功出圈,其使用的GRPO算法受到了业界的广泛
成功率100%!卡内基梅隆大学机器人研究所提出SWIFT系统,实现仅凭现实交互学习复杂技能! 下午11时 2025/02/25 作者 机器人大讲堂 行器因其可变形手指的柔韧性,能够在与周围环境互动时表现出良好的适应性和安全性。然而,这种柔韧性也使得
极客说|微软 Phi 系列小模型和多模态小模型 下午4时 2025/01/08 作者 AIGC开放社区 专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发