诚邀参加 青岛AICC”用昇腾玩转DeepSeek、Qwen开发实战”集训营活动 2025年3月21日23时 作者 极市干货 多模态大模型深入解读专栏介绍,涵盖Transformer系列、LVM模型及扩散模型等内容。
13年后,AlexNet源代码终于公开:带注释的原版 2025年3月21日23时 作者 极市干货 AlexNet源代码现已公开,该模型在2012年ImageNet挑战赛中获胜,并对计算机视觉领域产生了深远影响。
AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025 2025年3月19日23时 作者 极市干货 沿研究中一窥复制 Manus 的启示。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 Man
CVPR 2025 满分论文|清华提出TSP3D:基于语言引导空间剪枝的高效3D视觉Grounding 2025年3月19日23时 作者 极市干货 名为 TSP3D 的高效 3D 视觉定位框架,通过语言引导的空间剪枝和多层稀疏卷积架构,实现了高精度
自回归模型还能这么玩?kaiming团队:我们真的不需要矢量量化|自回归视觉生成模型系列解读 2025年3月19日23时 作者 极市干货 不是必需的。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 本文目录 1 MAR:不使用 V
CVPR 2025 清华提出MambaIRv2:图像复原超强SOTA模型 2025年3月18日23时 作者 极市干货 com/p/9375585949 编辑丨极市平台 极市导读 本文提出了 MambaIRv2,一种用于
结合代码聊聊FlashAttentionV3前向过程的原理 2025年3月18日23时 作者 极市干货 绍了FlashAttentionV3(FA3)的前向过程原理,结合代码分析了其数学公式和工程实现的细
尝试基于小模型(0.5B)复现DeepSeek-R1的思维链 2025年3月18日23时 作者 极市干货 认识这个过程,而不是严谨地对每一个剖析细节,因此基本没有公式推导,但一些必要的符号是避免不了的; 第
破解LoRA融合密码!无需训练夺得SOTA!K-LoRA巧用Top-K策略,让风格与主体完美融合 2025年3月17日23时 作者 极市干货 -LoRA是一种无需额外训练的LoRA融合方法,通过Top-K选择机制和缩放因子,能有效融合独立训练