学术归档 - 第194页共283页

ICLR 2025｜如何在ImageNet-1K上训练视觉基础模型？

2025年2月13日23时作者极市干货

练就可以在多项任务上达到跟别人所提供的预训练模型相当的性能。
>>
加入极市CV技术交流群，走在计算

谈谈DeepSeek-R1满血版推理部署和优化

2025年2月13日23时作者极市干货

着一起卷了一阵, 其实推理中还有很多约束, 比较认同的是章老师的一个观点: “推理框架很有可能就此走

EMNLP 2025 征稿通知

2025年2月13日19时作者机器学习算法与自然语言处理

MLNLP社区是国内外知名的机器学习与自然语言处理社区。EMNLP 2025将于2025年11月在苏州召开，采用ARR投稿通道，截稿日期为2025年5月19日。会议涵盖多种主题，包括但不限于代码模型解释性、跨学科影响等。

DeepSeek R1不编程就能生成GPU内核，比熟练工程师好，惊到了英伟达

2025年2月13日16时作者机器之心

英伟达利用DeepSeek-R1和推理时扩展技术来自动生成优化GPU内核，验证器在闭环方式下引导代码生成过程，为96%的Level-2问题生成数值正确的内核。

哥德尔-Prover超过DeepSeek-Prover，金驰、陈丹琦团队造出当前最强形式化推理模型

2025年2月13日16时作者机器之心

近日，普林斯顿大学团队开源了用于自动定理证明的形式化推理模型Goedel-Prover，并在数学问题的自动形式化证明生成任务上达到SOTA。该模型基于两个形式化转换器训练，其中一个基于Lean Workbook中的非形式-形式语言对训练，另一个采用Claude-sonnet-3.5标注的语言对进行训练。通过专家迭代方法提升性能，在miniF2F上的正确率比最优模型提高7.6%。