月度归档: 2025 年 6 月
难度爆表!从 LLM 到 Infra,手撕 5 大并行训练算法
现高校LLM对齐研究课程介绍,涵盖手撕PyTorch五大并行算法DP、TP、PP、CP和EP,以及Backward梯度计算与重叠通信技术。课程内容丰富,提供多卡DeepSpeed RLHF训练及垂域大模型实操项目。
OpenAI 高管凌晨发飙:「有人闯进我们家偷东西了!」
OpenAI首席研究官Mark Chen回应Meta挖角,承诺重新调整薪酬留住顶尖人才,并计划让员工休息充电。同时指出当前过于纠结于短期产品发布节奏和与竞争对手的比较,希望重新聚焦于实现通用人工智能的目标。
图像界的DeepSeek!12B参数对标GPT-4o,5秒出图,消费级硬件就能玩转编辑生成
Black Forest Labs发布开源图像模型FLUX.1 Kontext[dev],专为图像编辑设计,性能媲美闭源模型,支持精确上下文生成和编辑。
OpenAI 四位华人 AI 大牛集体被挖!清北浙大中科大校友,小扎杀疯了
Meta 再次挖角 OpenAI 4 名研究员助力超级智能计划,涉及多模态模型开发等方向。清北等高校出身的研究人员包括 Shengjia Zhao、Jiahui Yu 等,近期 Meta 派遣大量人才争夺战席卷 AI 行业。华人 AI 研究员在中国顶尖研究机构培养后,成为全球竞争的重要力量。
ICML 2025丨慕尼黑工业大学等基于SD3开发卫星图像生成方法,构建当前最大规模遥感数据集
大学的团队提出以地理气候提示为条件并使用 Stable Diffusion 3 (SD3)生成卫星图