Swift 归档 - 每时AI

DeepSeek同款GRPO训练大提速！魔搭开源全流程方案，支持多模态训练、训练加速和评测全链路

2025年3月9日16时作者量子位

elScope魔搭社区。
随着DeepSeek-R1的成功出圈，其使用的GRPO算法受到了业界的广泛

2025年2月25日23时作者机器人大讲堂

行器因其可变形手指的柔韧性，能够在与周围环境互动时表现出良好的适应性和安全性。然而，这种柔韧性也使得

2025年1月8日16时作者 AIGC开放社区

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发