多任务学习归档 - 每时AI

游戏教父 John Carmack：LLM 不是游戏的未来

2025年6月16日16时作者 AI前线

e
Id Software 成立于 90 年代，作为创始人之一，我参与开发了《指挥官基恩》、《德军总

还得是华为！Pangu Ultra MoE架构：不用GPU，你也可以这样训练准万亿MoE大模型

2025年5月29日16时作者机器之心

万亿 MoE 模型，此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra M

Claude 4 核心成员访谈：提升 Agent 独立工作能力，强化模型长程任务能力是关键

2025年5月28日23时作者 Founder Park

的两位研究员，Sholto Douglas（专注于强化学习）和 Trenton Bricken（研究

LoRA中到底有多少参数冗余？新研究：砍掉95%都能保持高性能

2025年5月2日16时作者机器之心

明即使大幅减少 LoRA 的可训练参数，模型性能依然保持强劲。研究团队在数学推理、代码生成、安全对齐

ICLR 2025 Oral｜差分注意力机制引领变革，DIFF Transformer攻克长序列建模难题

2025年4月28日23时作者机器之心

建模能力为语言理解与生成带来了前所未有的突破。
然而，随着模型规模的不断扩大和应用场景的日益复杂，传

只需 0.5B 参数，全面覆盖预训练+SFT + RL！极简自回归视觉生成框架SimpleAR

2025年4月28日23时作者极市干货

的极简自回归视觉生成框架。
>>
加入极市CV技术交流群，走在计算机视觉的最前沿
本文目录
1 Si

Roblox发布3D智能基础模型Cube，一句话生成游戏资产

2025年3月21日23时作者机器之心

AI 技术，进一步革新游戏的创作体验。
据了解，曾获选「儿童票选奖最受欢迎游戏」的 Roblox