DeepSeek-R1 技术剖析:没有强化学习基础也能看懂的 PPO & GRPO 2025年3月25日23时 作者 极市干货 .zhihu.com/p/22128744640 编辑丨极市平台 极市导读 本文以通俗易懂的方式剖析
CVPR2025|恺明+LeCun联手带来没有归一化层的Transformer! 2025年3月16日23时 作者 极市干货 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 本文目录 1 DyT:取代 Transform
NeurIPS 2024 从分类到生成:斯坦福、北大等提出无训练的可控扩散生成 2024年12月5日20时 作者 PaperWeekly ©作者 | 叶皓天 单位 | 斯坦福大学博士生 来源 | 机器之心 近年来,扩散模型(Diffusi