DeepSeek开源最新大模型,数学能力大突破!
DeepSeek开源了V2数学大模型,参数量分别为671B和7B,在MiniF2F测试中的通过率为88.9%,在ProverBench中包含325个问题的评估集。
DeepSeek开源了V2数学大模型,参数量分别为671B和7B,在MiniF2F测试中的通过率为88.9%,在ProverBench中包含325个问题的评估集。
近日,普林斯顿大学团队开源了用于自动定理证明的形式化推理模型Goedel-Prover,并在数学问题的自动形式化证明生成任务上达到SOTA。该模型基于两个形式化转换器训练,其中一个基于Lean Workbook中的非形式-形式语言对训练,另一个采用Claude-sonnet-3.5标注的语言对进行训练。通过专家迭代方法提升性能,在miniF2F上的正确率比最优模型提高7.6%。