月之暗面开源改进版Muon优化器,算力需求比AdamW锐减48%,DeepSeek也适用

OpenAI团队的优化算法Muon在更大模型和数据集上的应用效果被月之暗面团队验证,改进后的Muon对1.5B参数量Llama架构模型的算力需求仅为AdamW的52%,同时基于DeepSeek架构训练出一个16B的MoE模型并开源。

这家AI公司杀疯了!一分钟让你秒变设计师,想要颠覆万亿珠宝行业

Arcade利用AI技术让用户通过简单的自然语言指令生成个性化珠宝设计,并在21天内完成生产并配送。平台连接了来自全球的小众供应商和设计师,用户可从多个选项中选择材料、尺寸等参数来定制产品,甚至还能从中抽佣销售自己设计的作品。