Windsurf抢先Cursor发布自研AI模型!

 

最近的 AI 编码助手领域,真是越来越热闹了!就在 2025 年 5 月 15 日,很多开发者关注的 Windsurf 发布了其 v1.9.0 版本。这次更新带来了一个重磅消息:Windsurf 推出了全新的 SWE-1 系列自研 AI 模型。这个动作,让不少人觉得,在自研 AI 模型的道路上,Windsurf 似乎抢先一步,让老对手 Cursor 有点措手不及。

根据 Windsurf 官方发布的信息,这次他们一次性推出了一个”模型家族”,包括三个新成员:SWE-1SWE-1-Lite 和 SWE-1-Mini。这不仅仅是简单的升级,更像是 Windsurf 在 AI 核心技术上的一次重要宣告

我们来看看这些新模型具体是什么:

  • • SWE-1 模型
    • • 这是 Windsurf 自家打造的全新模型,直接集成在 Windsurf 的 Cascade 功能中。
    • • 官方说,SWE-1 拥有”达到前沿模型水平的能力 (frontier model-level capabilities)”。Windsurf 在社交媒体上也提到:”基于内部评估,它的性能接近于那些顶尖实验室推出的前沿模型!”
    • • 更吸引人的是,Pro 用户可以限时免费体验这个强大的新模型。
  • • SWE-1-Lite 模型
    • • 这个模型也很有看点。它是一个全新的、能力更强的模型,用来替代之前的 Cascade Base 模型。
    • • 好消息是,SWE-1-Lite 对所有用户免费开放,不管你用的是什么套餐。
  • • SWE-1-Mini 模型
    • • Windsurf 也改进了大家常用的代码补全功能。SWE-1-Mini 就是为此而生的,它是一个优化过的、用于 Windsurf 中 tab 补全的模型。

为了更直观地展示这些新模型的性能,Windsurf 还放出了一些评测数据。

端到端任务评测 (End-to-End SWE Task Benchmark)

这张图展示了模型从零开始独立解决一个完整软件工程任务的能力。在”前沿模型 (Frontier models)”的对比中,Windsurf 的 SWE-1 模型表现非常出色,其得分与 Claude Sonnet 3.7、Deepseek V3 等业界领先模型处于同一水平,甚至在图表中略微领先。这表明 SWE-1 在独立处理复杂任务方面具有很强的竞争力。在”中等规模模型 (Mid-sized models)”类别中,SWE-1 Lite 也展现了强劲的性能,得分优于 Claude Haiku 3.5 和 Qwen 3 等模型。

对话式任务评测 (Conversational SWE Task Benchmark)

此评测关注的是在已有的对话和编码上下文中,模型根据用户后续指令继续完成任务的能力,这更能体现模型在人机协作场景下的实用性。结果显示,SWE-1 在”前沿模型”中依然保持了高水准,能很好地理解并执行在持续对话中提出的需求。SWE-1 Lite 在”中等规模模型”中也表现优异。这些数据说明 Windsurf 的模型不仅能独立完成任务,在与开发者互动、迭代式地解决问题时也同样高效可靠。


那么,Windsurf 这次发布自研模型,到底意味着什么呢?

首先,这说明 Windsurf 不再仅仅依赖外部或者通用的 AI 技术。他们开始构建自己的核心竞争力。拥有自研模型,可以让他们更好地控制模型迭代的方向,根据软件工程的实际需求进行深度优化。

昨天还发布了一篇文章讨论有关 Cursor 的护城河在哪里?,今天 Windsurf 就发布了自研模型,这也会让 Windsurf 在 AI 编码工具领域,拥有更强的竞争力。

这些模型的目标是 “前沿模型水平的能力”。这显示了 Windsurf 的雄心。他们希望为开发者提供真正顶级的 AI 编码辅助。从官方信息看,这些新模型,特别是 SWE-1,被寄予厚望,要直接挑战业内最强的那些模型。

对于用 Windsurf 的开发者来说,这当然是个好消息。自研模型理论上能带来更贴合开发场景的智能体验,比如更精准的代码生成、更理解上下文的辅助,还有可能更快的响应速度。


Hacker News 上的一些开发者也对此发表了看法。

有评论提到,通用的 AI 大模型虽然能力广泛,但在编程这类专业任务上,可能不如专门优化的模型效果好。Windsurf 选择自研,不仅可能提升编码辅助的专业度,还能构建自己的技术壁垒。同时,也有观点认为,长期依赖第三方模型 API 的成本较高,自研或许也是出于经济效益的考量。更有价值的是,像 Windsurf 这样的编辑器,能够收集到大量开发者在真实工作场景中的交互数据,例如处理不完整的代码、执行耗时较长的任务等。这些独特的数据对于训练出更懂软件开发流程、更能胜任复杂工程任务的 AI 模型至关重要,这可能是它们相较于通用大模型提供商的一个关键优势。

放眼整个 AI 编码工具市场,Windsurf 的这个举动无疑给竞争对手带来了压力,特别是经常被拿来和它比较的 Cursor。当其他工具还在主要依赖第三方大模型 API 的时候,Windsurf 已经开始”自己造发动机”了。这可能让 Windsurf 在功能迭代、成本控制和特性定制方面,比别人有更多的主动权。

总的来说,Windsurf 推出 SWE-1 系列自研 AI 模型,是它发展过程中的一个重要里程碑。这不仅展示了它的技术实力,也预示着 AI 编码工具的竞争会更加激烈。至于 Windsurf 是否真的能凭借这次更新”领先 Cursor 一步”,还需要开发者们实际体验后,用脚投票。

但不管怎么说,有竞争总是好的。我们期待看到更多像 Windsurf 这样,能给开发者带来惊喜的工具出现!

你对 Windsurf 这次的新模型有什么看法?欢迎在评论区留言讨论!


(文:AI智见录)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往