月之暗面开源改进版Muon优化器,算力需求比AdamW锐减48%,DeepSeek也适用

OpenAI团队的优化算法Muon在更大模型和数据集上的应用效果被月之暗面团队验证,改进后的Muon对1.5B参数量Llama架构模型的算力需求仅为AdamW的52%,同时基于DeepSeek架构训练出一个16B的MoE模型并开源。

3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?

波士顿动力机器狗Spot通过强化学习提高了3倍速度至18.7千米/小时,超越了小型犬的平均奔跑速度。研究人员发现限制机器人运动速度的主要因素是电池供电能力,并提出增加四脚同时离地的飞行阶段可提高速度和稳定性。

孙正义患DeepSeek焦虑症?首谈5000亿星际之门,每年算力暴增1000倍

孙正义斥资5000亿美元打造星际之门计划,预计未来10年超级智能对全球GDP影响至少5%,即9万亿规模。星际之门项目旨在投资高达5000亿美元,重塑全球AI能力,并有望在未来几年使AGI变得非常聪明甚至十亿倍智能。