一推理一编程,“AI六小龙”MiniMax、月之暗面同推开源模型
2025年初,’AI六小龙’几乎从舆论场中消失。MiniMax和月之暗面宣布开源新成果,并部署下一步路线。MiniMax-M1在软件工程、上下文处理等任务上表现出色,参数量达4560亿;Kimi-Dev-72B在编程基准测试中表现优异,参数量仅为72B。
2025年初,’AI六小龙’几乎从舆论场中消失。MiniMax和月之暗面宣布开源新成果,并部署下一步路线。MiniMax-M1在软件工程、上下文处理等任务上表现出色,参数量达4560亿;Kimi-Dev-72B在编程基准测试中表现优异,参数量仅为72B。
Kimi-Dev-72B是首个在SWE-bench Verified编程基准测试中取得全球最高开源模型成绩的代码大模型,参数量仅为72B。通过大规模强化学习优化,Kimi-Dev-72B不仅能在错误修复和单元测试方面表现出色,还支持自我博弈机制以同时担任BugFixer和TestWriter的角色。
MiniMax-M1发布首个开源混合注意力推理大模型,支持超长上下文和高效计算;Kimi-Dev-72B用于软件工程任务的开源代码LLM在SWE-bench上实现先进性能;Zibly提升大型语言模型应用分析;GHOSTCREW是基于AI的渗透测试助手;Roo Commander是一种智能工作流编排系统。