MiniMax开源首个混合注意力推理大模型,Kimi开源编码LLM
MiniMax-M1发布首个开源混合注意力推理大模型,支持超长上下文和高效计算;Kimi-Dev-72B用于软件工程任务的开源代码LLM在SWE-bench上实现先进性能;Zibly提升大型语言模型应用分析;GHOSTCREW是基于AI的渗透测试助手;Roo Commander是一种智能工作流编排系统。
MiniMax-M1发布首个开源混合注意力推理大模型,支持超长上下文和高效计算;Kimi-Dev-72B用于软件工程任务的开源代码LLM在SWE-bench上实现先进性能;Zibly提升大型语言模型应用分析;GHOSTCREW是基于AI的渗透测试助手;Roo Commander是一种智能工作流编排系统。
OpenAI发布Codex,一款为软件工程任务优化的AI推理模型。Codex能生成更清晰、精准遵循指令的代码,并能同时处理多项任务。初期向ChatGPT Pro等订阅用户开放,支持与GitHub连接以预先加载代码仓库。
初创公司Windsurf推出首个AI软件工程模型系列SWE-1,旨在优化整个软件工程流程。该系列包括SWE-1、SWE-1-lite和SWE-1-mini,与Claude 3.7 Sonnet等前沿AI模型相比,在软件工程任务上仍落后。
OpenAI发布Codex预览版,支持编程、代码审查等任务,具备云端运行和独立隔离环境特性,并推出轻量级版本Codex CLI,定价1.5美元/百万tokens输入。
中国信通院发布《AI4SE行业现状调查报告》,指出软件工程智能化转型势在必行。企业软件研发智能化成熟度普遍处于L2水平,AI技术应用比例显著提升,代码生成占比同比增加6%,测试用例生成效果明显,但智能开发工具仍需提升。
Manus 是首个通用 AI 智能体,能够处理数据收集、分析、招聘等多种任务。它在多项基准测试中表现优异,并得到了广泛的好评。目前仅通过邀请码注册使用。
Claude 3.7 Sonnet是Anthropic最新推出的AI模型,主打‘会思考’。它在软件工程、推理和数学方面表现更出色,并引入了Extended Thinking功能让思考过程可视化。