DeepSeek加持,北大通院几何模型达IMO金牌水平!32个CPU核心和1块4090就能实现满血解题

国产AI几何模型TongGeometry能解决IMO-AG-30题中的所有30题,以及IMO-AG-50上的42题,并达到人类金牌选手平均水平。它使用策略网络和价值网络联合Beam Search进行解题,性能远超谷歌AlphaGeometry,仅需32个CPU核心和1块4090就能实现满血解题。

Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布

中国研究员联合DeepMind团队提出的新研究《Lavender: Diffusion Instruction Tuning》,通过“注意力对齐”让Stable Diffusion教Llama-3.2等模型“看图说话”,性能提升30%,且代码、模型、训练数据将全部开源。

不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限

上海AI Lab提出的新方法OREAL利用基于结果奖励的强化学习超越了DeepSeek,无需超大规模模型蒸馏。通过模仿正样本、偏好负样本并关注关键步骤,实现了数学推理任务上的显著提升,并开源训练数据和模型以促进研究对比。