RoboMamba:推理速度提升7倍,北大如何打造高效机器人多模态大模型? 下午2时 2025/04/18 作者 小兵的AI视界 北京大学团队推出RoboMamba,一款高效多模态机器人模型,旨在提升复杂任务的推理与决策能力。其核心目标是增强视觉和语言集成能力、优化微调策略,并降低训练成本。
初探最大更新参数化muP:超参数的跨模型尺度迁移规律 下午11时 2025/03/30 作者 PaperWeekly 经网络 众所周知,完整训练一次大型 LLM 的成本是昂贵的,这就决定了我们不可能直接在大型 LLM