哥德尔-Prover超过DeepSeek-Prover,陈丹琦团队造出当前最强形式化推理模型

近日,普林斯顿大学团队开源了用于自动定理证明的形式化推理模型Goedel-Prover,并在数学问题的自动形式化证明生成任务上达到了SOTA。该模型利用大规模形式化定理数据集和专家迭代方法训练,提高了解题正确率并在排行榜中取得优异成绩。

啊?7B的DeepSeek反超R1满血版,上海AI Lab周伯文团队新成果:计算最优的Test-Time Scaling

上海AI Lab/清华哈工大/北邮团队的研究表明,通过改进Test-Time Scaling(TTS)方法,在数学推理任务上提升了小模型的性能。该研究发现最优的TTS方法高度依赖于具体的策略模型、过程奖励模型和问题难度。