极市干货，作者每时AI

ICLR 2025｜如何在ImageNet-1K上训练视觉基础模型？

2025年2月13日23时作者极市干货

练就可以在多项任务上达到跟别人所提供的预训练模型相当的性能。
>>
加入极市CV技术交流群，走在计算

2025年2月13日23时作者极市干货

着一起卷了一阵, 其实推理中还有很多约束, 比较认同的是章老师的一个观点: “推理框架很有可能就此走

2025年2月12日23时作者极市干货

eQuant的后训练量化（PTQ）方法，通过引入等价的仿射变换扩展了优化范围，显著降低了量化误差，尤

2025年2月12日23时作者极市干货

B！多机构联手巧妙应用计算最优TTS策略，不仅0.5B模型在数学任务上碾压GPT-4o，7B模型更是

2025年2月12日23时作者极市干货

径比较清晰，意在初步梳理DeepSeek技术的演进及进化之路，主要包括三大方向：大语言模型、视觉语言

2025年2月11日23时作者极市干货

台
极市导读
深入探讨DeepSeek的技术突破及其对AI行业的影响。
>>
加入极市CV技术交流群

2025年2月11日23时作者极市干货

ETok在仅使用128个token的情况下，于256×256和512×512分辨率的ImageNet

2025年2月10日23时作者极市干货

感知计算和可学习幂函数，PolaFormer在保持线性复杂度的同时，显著提升了模型的性能和效率，并在

2025年2月10日23时作者极市干货

MIT副教授何恺明的新研究揭示，尽管过去十多年里业界为构建更大、更多样化数据集做了努力，但现代神经网络似乎越来越善于‘识破’并利用这些数据集中潜藏的偏差。此发现引发对消除数据集偏差是否已取得胜利的质疑。

2025年2月10日23时作者极市干货

u.com/p/21290410831
编辑丨极市平台
极市导读
Deepseek R1 Zero模