推理性能归档 - 每时AI

DeepSeek 发布DeepSeek R1-0528

2025年5月30日8时作者 NLP工程化

DeepSeek发布R1-0528，显著提升代码生成能力，推理速度和质量提高，性能接近OpenAI的o3等前沿模型，在数学、编程和复杂任务上表现出色。

ICLR 2025 四川大学提出Test-time Adaptation新范式，突破查询偏移挑战

2025年3月17日23时作者机器之心

ver 在其主题报告中展望了基础模型的未来研究方向，其中包括了 Inference Time Com

Oat-Zero：深度剖析AI模型自我反思行为的轻量级复现项目

2025年2月8日8时作者 NLP工程化

Oat-Zero项目深入剖析AI模型的自我反思行为，并通过强化学习优化其推理能力，提供完整的实验复现步骤。