月之暗面又开源了!登顶全球第一,还超了新版DeepSeek-R1
Kimi-Dev-72B是首个在SWE-bench Verified编程基准测试中取得全球最高开源模型成绩的代码大模型,参数量仅为72B。通过大规模强化学习优化,Kimi-Dev-72B不仅能在错误修复和单元测试方面表现出色,还支持自我博弈机制以同时担任BugFixer和TestWriter的角色。
Kimi-Dev-72B是首个在SWE-bench Verified编程基准测试中取得全球最高开源模型成绩的代码大模型,参数量仅为72B。通过大规模强化学习优化,Kimi-Dev-72B不仅能在错误修复和单元测试方面表现出色,还支持自我博弈机制以同时担任BugFixer和TestWriter的角色。
Kimi发布开源代码模型Kimi-Dev,在SWE-bench Verified上取得60.4%成绩,参数量只有72B。该模型采用BugFixer和TestWriter两种角色的结合进行训练,目前权重和代码均已发布。