miniF2F 归档 - 每时AI

DeepSeek开源最新大模型，数学能力大突破！

2025年5月1日11时作者 AIGC开放社区

DeepSeek开源了V2数学大模型，参数量分别为671B和7B，在MiniF2F测试中的通过率为88.9%，在ProverBench中包含325个问题的评估集。

DeepSeek开源Prover-V2强推理模型，网友：奥数从没这么简单过

2025年5月1日11时作者机器之心

的新消息可没停下来。
前些天到处都在流传着 DeepSeek-R2 即将发布的传言，DeepSee

哥德尔-Prover超过DeepSeek-Prover，金驰、陈丹琦团队造出当前最强形式化推理模型

2025年2月13日16时作者机器之心

近日，普林斯顿大学团队开源了用于自动定理证明的形式化推理模型Goedel-Prover，并在数学问题的自动形式化证明生成任务上达到SOTA。该模型基于两个形式化转换器训练，其中一个基于Lean Workbook中的非形式-形式语言对训练，另一个采用Claude-sonnet-3.5标注的语言对进行训练。通过专家迭代方法提升性能，在miniF2F上的正确率比最优模型提高7.6%。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28