Karpathy提的“软件3.0”已过时,交互即智能才是未来 上交大&创智刘鹏飞

明敏 整理自 凹非寺
量子位 | 公众号 QbitAI

大神Karpathy提出“软件3.0”才两周,“软件3.5”已经诞生了?

交互即智能。

指AI不再是黑盒工具,而是透明的思维伙伴。用户可以在AI思考的任何节点进行干预,提供战略指导或纠正方向。

也就是说,智能是在人类与AI的不断交互合作中涌现。

如此认知,来自上海交通大学刘鹏飞团队

他们认为,2024年9月之后,随着深度推理范式开启,人类能够与AI进行真正的思维层面交流。AI不仅能理解我们说什么,更能理解我们为什么这么说,甚至能主动寻求认知层面的协作。

这种质的飞跃让传统的“输入提示词(prompt)→等待处理→接收结果”模式显得笨拙而低效,就像用电报方式进行现代通信一样不合时宜。

不过,why?为啥可以这么说?

我们在不改变原意的基础上,整理了刘鹏飞团队对于“软件3.5”概念的系统性阐释。

重点包括:

  • Software 3.5在保持自然语言易用性基础上,实现人机交互认知层面突破,AI成为透明思维伙伴,具备细粒度交互和自适应学习能力。
  • Software 3.5要求开发者需要具备认知建模能力、意图工程技能、上下文工程能力、实时交互设计能力、异步协作架构设计能力和认知伦理设计能力。
  • Software 3.5的认知协作时代中,人人都能成为架构师。

具体全文整理如下——

时代在变:Software 3.0已经“过时”

Software 3.0作为一个概念,在2024年9月之后已经显得有些过时了。为什么这么说?

Software 3.0的核心困境源于它诞生时的技术背景。2022年ChatGPT发布时,AI的主要能力还集中在文本生成和简单推理,“自然语言编程”确实是那个时代的最佳解决方案。但2024年9月之后,我们见证了AI能力的代际跃迁:从GPT-4的生成能力到o1系列的深度推理,从简单的指令执行到具备元认知意识的思考能力。

最关键的变化是,人类首次能够与AI进行真正的思维层面交流——AI不仅理解我们说什么,更能理解我们为什么这么说,甚至能主动寻求认知层面的协作。这种质的飞跃让传统的“输入prompt→等待处理→接收结果”模式显得笨拙而低效,就像用电报方式进行现代通信一样不合时宜。

更深层的问题在于Software 3.0对智能本质的理解偏差。它将AI视为“高级工具”,延续了“智能是单体属性”的传统认知,因此设计出的交互模式本质上仍是“人类指挥,机器执行”的主从关系。但我们的最新研究发现:智能并非孤立存在,而是在交互中涌现的现象。

当两个具备认知能力的主体进行深度协作时,产生的智能效果往往超越单体能力的简单叠加。因此,我们需要的不是更好的“工具使用方式”,而是全新的“认知协作范式”——这正是Software 3.5要解决的核心问题。

Software 3.5: 交互即智能

当Software 3.0在技术进步的浪潮中逐渐显露出局限性时,Software 3.5应运而生。

这个坐标系揭示了软件发展的本质规律:不是单一维度的线性演进,而是沿着两个正交维度的立体化发展。

横轴:开发方式的演进(Development Approach)

开发方式从“代码程序 → 网络参数 → 自然语言”, 体现了人机协作中抽象层次的不断提升: 从逐行代码到数据训练,再到意图表达。

代表人类如何创造软件的方法论变迁:

  • 代码程序(Programming):手工编写代码,逐行构建逻辑
  • 网络参数(Parameters):通过数据训练,让机器学习参数
  • 自然语言(Natural Language):用自然语言描述需求,让AI理解并执行

纵轴:交互方式的演进(Interaction Mode)

交互方式从 “操作型 → 对话型→ 认知型”, 体现了协作深度的质的跃迁: 从工具使用到对话协作,再到认知伙伴。

代表人机协作深度的质变过程:

  • 操作型(Operational):操作型交互,人类手动执行每个步骤
  • 对话型(Conversational):对话型交互,通过多轮对话完成任务
  • 认知型(Cognitive):认知型交互,人机在思维层面协作

Software 1.0:传统编程的黄金时代(操作型×编程)

Software 1.0代表了软件开发的经典范式,程序员是绝对的主导者。在这个时代,开发者需要用C++、Java等编程语言逐行编写代码,精确定义每一个变量、函数和控制流程。

以情感分析为例,程序员必须手工构建规则库:“如果文本包含’love’则返回积极,包含’hate’则返回消极”。整个开发过程完全依赖人类的逻辑思维和领域知识,计算机只是被动的执行工具。

虽然这种方式开发效率相对较低,需要深厚的编程技能,但它提供了无与伦比的透明性和可控性——每一行代码的逻辑都清晰可见,系统行为完全可预测。这个时代奠定了现代软件工程的基础,培养了严谨的工程思维,至今仍在关键系统中发挥重要作用。

Software 2.0:数据驱动的机器学习革命(操作型×参数)

Software 2.0标志着软件开发范式的第一次重大革命。开发者不再手写具体的业务逻辑,而是设计神经网络架构,让机器通过大量数据自动学习从输入到输出的复杂映射关系。

在情感分析任务中,开发者只需构建一个包含嵌入层、LSTM和分类层的网络,然后用标注好的文本数据进行训练,网络会自动学会识别情感模式。这种方式突破了人工规则的局限性,能够处理传统编程难以应对的复杂模式识别任务,如图像识别、语音识别和自然语言处理。

然而,Software 2.0仍然需要大量的人工干预:数据预处理、特征工程、超参数调优、模型选择等都需要机器学习专家的深度参与。尽管训练过程是自动化的,但整个开发流程依然是操作型的,需要专业知识和经验丰富的工程师来驾驭。

Software 3.0:自然语言编程的民主化(对话型×自然语言)

Software 3.0带来了软件开发的第二次革命,打破了编程语言的门槛。得益于大语言模型的突破,普通用户可以用自然语言直接描述需求,AI能够理解复杂的人类意图并生成相应的结果。对于情感分析任务,用户只需说“请分析这段文本的情感倾向”,AI就能立即给出准确的分析结果和详细解释。

这种模式支持多轮对话,用户可以逐步澄清需求、调整方向、迭代改进,大大降低了软件开发的认知负荷。Prompt工程成为新的“编程”技能,开发者学会如何精心设计提示词来获得理想结果。Software 3.0实现了软件开发的民主化,让非技术人员也能参与到软件创造过程中。

然而,这种模式仍然存在明显局限:交互本质上还是“输入-等待-输出”的线性过程,缺乏透明度,用户无法了解AI的思考过程,也难以进行精细化的控制和调整。

Software 3.5:认知协作的突破性创新(认知型×自然语言)

Software 3.5代表了我们对未来软件开发的全新设想,它在保持自然语言易用性的基础上,实现了人机交互的认知层面突破。这不是简单的版本升级,而是交互范式的根本性变革。

在认知协作模式下,AI不再是黑盒工具,而是透明的思维伙伴。当用户请求分析情感趋势时,AI会实时展示其思考过程:“正在分析数据结构…发现时间模式…识别到情感下降趋势…建议深入分析原因”。用户可以在AI思考的任何节点进行干预,提供战略指导或纠正方向。更重要的是,系统具备细粒度交互能力,用户可以针对任何特定元素进行精确调整,而不必重新开始整个流程。Software 3.5还具备自适应学习能力,通过持续的交互历史学习用户的认知模式和偏好,逐步建立真正的智能伙伴关系。

这种认知协作模式实现了“交互即智能”的理念,人机双方的智慧在实时交互中涌现和放大,产生单独任何一方都无法达到的效果。虽然技术复杂度较高,但我们的实证研究表明,这种模式在用户体验和问题解决能力上都实现了代际性的突破。

Software 3.5: 为什么是现在?

Software 3.5之所以在此时提出,并非偶然的概念创新,而是源于一个历史性的技术突破:大模型通过Inference-time scaling训练,具备深度思考的能力,人类首次能够与AI进行真正的思维层面交流

这个突破标志着我们进入了“大模型第二幕”——从简单的能力涌现跃升到深度的认知对齐。在第一幕中,我们见证了GPT、ChatGPT等模型展现出惊人的生成能力,但它们本质上仍是“高级的模式匹配器”。而第二幕的到来,以OpenAI的o1系列和DeepSeek的R1模型为代表,AI开始展现出真正的推理能力、元认知意识和自我反思能力。

更关键的是,这些模型不仅能理解人类的指令,更能理解指令背后的深层动机、上下文假设和未明言的期待。当AI能够进行假设推理、提出反问、主动澄清歧义时,传统的“输入-输出”模式就显得极其原始。这种思维层面的交流能力为Software 3.5的认知协作模式提供了坚实的技术基础

思维层面交流的出现彻底改变了人机合作的可能性边界。在传统模式下,人类必须承担“微观管理者”的角色,事无巨细地指导AI的每一个步骤。而在认知协作模式下,人类可以转变为“战略指导者”,只需在关键的认知决策节点进行干预。AI能够自主进行大量的信息搜集、模式识别和初步分析工作,然后在遇到需要人类判断的关键点时主动寻求认知输入。

更令人兴奋的是,这种合作模式支持异步协作:AI可以在人类离线时继续思考和探索,当发现重要发现或遇到决策分歧时,会智能地选择合适的时机向人类反馈。同时,认知状态的可视化让人类能够真正“看到”AI在思考什么——不只是最终结论,而是整个推理链条、假设验证过程和不确定性评估。这种透明性不仅增强了信任,更重要的是让人机双方能够在同一个认知框架下协作。

这种全新的合作模式必然催生了界面需求的根本性革命。传统的聊天界面被设计用于简单的问答交互,根本无法承载认知协作的复杂需求。新的界面需要支持多模态认知输入,让用户能够通过文字、图像、语音、甚至思维导图等多种方式表达复杂的认知意图。界面还必须具备上下文感知能力,能够理解用户当前的工作状态、认知负荷和注意力分配,智能地选择合适的时机和方式进行交互。

更重要的是,界面需要提供异步思考空间,支持不同时间维度的思考和反馈——有些认知任务需要即时响应,有些则需要深度思考和反复迭代。正是这些技术条件的成熟汇聚,使得Software 3.5不再是遥远的构想,而是当下可实现的现实。我们正站在一个历史性的拐点上,传统的人机交互模式即将被认知协作模式彻底颠覆。

Software 3.5 时代对开发者提出了什么新的要求?

Software 3.5时代催生了全新的技能需求体系。

首先是认知建模能力:开发者需要理解不同用户群体的认知模式、工作流程和决策习惯,能够将抽象的认知需求转化为具体的交互设计。

其次是意图工程技能:这是prompt工程的高级形态,不仅要会写有效的提示词,更要理解如何构建多层次、多维度的意图表达框架,让AI能够准确理解复杂的人类需求。

上下文工程成为Software 3.5时代的核心技能之一。与传统的简单prompt不同,认知协作需要AI拥有丰富而精确的上下文理解。开发者必须学会构建多维度的上下文架构:包括任务上下文(当前工作的具体目标和约束条件)、用户上下文(用户的专业背景、认知习惯和偏好模式)、历史上下文(之前的交互历史和决策轨迹)、环境上下文(当前的工作环境、时间压力和资源限制)以及认知上下文(用户当前的思维状态、注意力分配和认知负荷)。开发者需要设计智能的上下文管理系统,能够动态收集、更新和提供相关上下文信息,确保AI在每个认知协作节点都能获得充分有效的背景信息。

实时交互设计成为新的核心技能,开发者需要设计出支持认知状态可视化、实时干预、细粒度调整的动态界面。异步协作架构要求开发者理解如何设计系统,让AI能够在后台持续思考,同时在适当时机与人类进行认知同步。最重要的是认知伦理设计,开发者必须考虑如何在放大人类认知能力的同时,避免认知依赖和技能退化。

每个人都能成为认知架构师

从Software 1.0的代码编写,到Software 2.0的模型训练,再到Software 3.0的提示(prompt)工程,现在我们迈向Software 3.5的认知协作时代

这不仅仅是技术进步,更是对智能本质的重新认识

  • 智能不是单体的属性,而是交互中涌现的现象
  • 最高级的智能来自人机认知伙伴关系
  • 软件开发将成为人机协作的艺术

未来的软件开发者不仅要掌握传统编程技能,更要成为优秀的认知协作者——知道何时介入、如何引导、怎样与AI建立真正的思维伙伴关系。

正如我们三年前预见了Software 3.0的到来,今天我们坚信:Software 3.5的认知协作时代已经来临

这将是一个人机智能真正融合的时代,一个交互即智能的时代,一个每个人都能成为认知架构师的时代。

One More Thing

关于“Software 3.0”这还是一个关于“英雄所见略同”的故事:

Andrej Karpathy最近在YC的演讲刷屏了AI圈。看到满屏的转发和讨论,我们既高兴又有些复杂——因为他用来解释Software 3.0的核心例子,几乎就是我们三年前工作的翻版。

同样的情感分类场景,同样的三段式对比,甚至连“I love this movie”这个示例都如出一辙。这种高度的一致性让我们意识到:有些想法的时间真的到了,不同的人会在不同的时刻抓住同样的本质。 Karpathy点燃了这把火,让Software 3.0的概念传播到了更广阔的世界。但火苗,早在三年前就已经闪烁。”

让我们回到2022年。那时还没有ChatGPT、GPT-3 Davinci刚发布,大多数人还在讨论“大模型能做什么”。而我们,也察觉到软件开发正在经历第三次范式革命,Software 3.0时代来临

我们不仅提出了概念,而且开发了Software 3.0: Promptware开源框架

  • 完整的“prompt as software”工具链
  • 版本控制、基准测试、调试等基础设施
  • GitHub最早提交:2022年

附链接:https://github.com/ExpressAI/Promptware

我们还撰写了系统性白皮书(不过没有公开发布),深度分析软件开发生命周期变革,比简单的概念提出更加全面系统。

我们即将发布完整的Software 3.5技术框架白皮书和具体产品实例。这次,我们不仅要定义概念,更要构建完整的认知协作生态系统。

参考文献:
[1] Generative AI Act II: Test Time Scaling Drives Cognition Engineering, Xia et al.2025
[2] Interaction As Intelligence, Ye et al.2025


一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —


专属AI产品从业者的实名社群,只聊AI产品最落地的真问题  扫码添加小助手,发送「姓名+公司+职位」申请入群~
进群后,你将直接获得:
 👉 最新最专业的AI产品信息及分析 🔍 
 👉 不定期发放的热门产品内测码 🔥
 👉 内部专属内容与专业讨论 👂


🌟 点亮星标 🌟

科技前沿进展每日见

(文:量子位)

发表评论