Karpathy提的“软件3.0”已过时，交互即智能才是未来上交大&创智刘鹏飞

明敏整理自凹非寺
量子位 | 公众号 QbitAI

大神Karpathy提出“软件3.0”才两周，“软件3.5”已经诞生了？

交互即智能。

指AI不再是黑盒工具，而是透明的思维伙伴。用户可以在AI思考的任何节点进行干预，提供战略指导或纠正方向。

也就是说，智能是在人类与AI的不断交互合作中涌现。

如此认知，来自上海交通大学刘鹏飞团队。

他们认为，2024年9月之后，随着深度推理范式开启，人类能够与AI进行真正的思维层面交流。AI不仅能理解我们说什么，更能理解我们为什么这么说，甚至能主动寻求认知层面的协作。

这种质的飞跃让传统的“输入提示词（prompt）→等待处理→接收结果”模式显得笨拙而低效，就像用电报方式进行现代通信一样不合时宜。

不过，why？为啥可以这么说？

我们在不改变原意的基础上，整理了刘鹏飞团队对于“软件3.5”概念的系统性阐释。

重点包括：

Software 3.5在保持自然语言易用性基础上，实现人机交互认知层面突破，AI成为透明思维伙伴，具备细粒度交互和自适应学习能力。
Software 3.5要求开发者需要具备认知建模能力、意图工程技能、上下文工程能力、实时交互设计能力、异步协作架构设计能力和认知伦理设计能力。
Software 3.5的认知协作时代中，人人都能成为架构师。

具体全文整理如下——

时代在变：Software 3.0已经“过时”

Software 3.0作为一个概念，在2024年9月之后已经显得有些过时了。为什么这么说？

Software 3.0的核心困境源于它诞生时的技术背景。2022年ChatGPT发布时，AI的主要能力还集中在文本生成和简单推理，“自然语言编程”确实是那个时代的最佳解决方案。但2024年9月之后，我们见证了AI能力的代际跃迁：从GPT-4的生成能力到o1系列的深度推理，从简单的指令执行到具备元认知意识的思考能力。

最关键的变化是，人类首次能够与AI进行真正的思维层面交流——AI不仅理解我们说什么，更能理解我们为什么这么说，甚至能主动寻求认知层面的协作。这种质的飞跃让传统的“输入prompt→等待处理→接收结果”模式显得笨拙而低效，就像用电报方式进行现代通信一样不合时宜。

更深层的问题在于Software 3.0对智能本质的理解偏差。它将AI视为“高级工具”，延续了“智能是单体属性”的传统认知，因此设计出的交互模式本质上仍是“人类指挥，机器执行”的主从关系。但我们的最新研究发现：智能并非孤立存在，而是在交互中涌现的现象。

当两个具备认知能力的主体进行深度协作时，产生的智能效果往往超越单体能力的简单叠加。因此，我们需要的不是更好的“工具使用方式”，而是全新的“认知协作范式”——这正是Software 3.5要解决的核心问题。

Software 3.5：交互即智能

当Software 3.0在技术进步的浪潮中逐渐显露出局限性时，Software 3.5应运而生。

这个坐标系揭示了软件发展的本质规律：不是单一维度的线性演进，而是沿着两个正交维度的立体化发展。

横轴：开发方式的演进（Development Approach）

开发方式从“代码程序 → 网络参数 → 自然语言”，体现了人机协作中抽象层次的不断提升：从逐行代码到数据训练，再到意图表达。

代表人类如何创造软件的方法论变迁：

代码程序（Programming）：手工编写代码，逐行构建逻辑
网络参数（Parameters）：通过数据训练，让机器学习参数
自然语言（Natural Language）：用自然语言描述需求，让AI理解并执行

纵轴：交互方式的演进（Interaction Mode）

交互方式从 “操作型 → 对话型→ 认知型”，体现了协作深度的质的跃迁：从工具使用到对话协作，再到认知伙伴。

代表人机协作深度的质变过程：

操作型（Operational）：操作型交互，人类手动执行每个步骤
对话型（Conversational）：对话型交互，通过多轮对话完成任务
认知型（Cognitive）：认知型交互，人机在思维层面协作

Software 1.0：传统编程的黄金时代（操作型×编程）

Software 1.0代表了软件开发的经典范式，程序员是绝对的主导者。在这个时代，开发者需要用C++、Java等编程语言逐行编写代码，精确定义每一个变量、函数和控制流程。

以情感分析为例，程序员必须手工构建规则库：“如果文本包含’love’则返回积极，包含’hate’则返回消极”。整个开发过程完全依赖人类的逻辑思维和领域知识，计算机只是被动的执行工具。

虽然这种方式开发效率相对较低，需要深厚的编程技能，但它提供了无与伦比的透明性和可控性——每一行代码的逻辑都清晰可见，系统行为完全可预测。这个时代奠定了现代软件工程的基础，培养了严谨的工程思维，至今仍在关键系统中发挥重要作用。

Software 2.0：数据驱动的机器学习革命（操作型×参数）

Software 2.0标志着软件开发范式的第一次重大革命。开发者不再手写具体的业务逻辑，而是设计神经网络架构，让机器通过大量数据自动学习从输入到输出的复杂映射关系。

在情感分析任务中，开发者只需构建一个包含嵌入层、LSTM和分类层的网络，然后用标注好的文本数据进行训练，网络会自动学会识别情感模式。这种方式突破了人工规则的局限性，能够处理传统编程难以应对的复杂模式识别任务，如图像识别、语音识别和自然语言处理。

然而，Software 2.0仍然需要大量的人工干预：数据预处理、特征工程、超参数调优、模型选择等都需要机器学习专家的深度参与。尽管训练过程是自动化的，但整个开发流程依然是操作型的，需要专业知识和经验丰富的工程师来驾驭。

Software 3.0：自然语言编程的民主化（对话型×自然语言）

Software 3.0带来了软件开发的第二次革命，打破了编程语言的门槛。得益于大语言模型的突破，普通用户可以用自然语言直接描述需求，AI能够理解复杂的人类意图并生成相应的结果。对于情感分析任务，用户只需说“请分析这段文本的情感倾向”，AI就能立即给出准确的分析结果和详细解释。

这种模式支持多轮对话，用户可以逐步澄清需求、调整方向、迭代改进，大大降低了软件开发的认知负荷。Prompt工程成为新的“编程”技能，开发者学会如何精心设计提示词来获得理想结果。Software 3.0实现了软件开发的民主化，让非技术人员也能参与到软件创造过程中。

然而，这种模式仍然存在明显局限：交互本质上还是“输入-等待-输出”的线性过程，缺乏透明度，用户无法了解AI的思考过程，也难以进行精细化的控制和调整。

Software 3.5：认知协作的突破性创新（认知型×自然语言）

Software 3.5代表了我们对未来软件开发的全新设想，它在保持自然语言易用性的基础上，实现了人机交互的认知层面突破。这不是简单的版本升级，而是交互范式的根本性变革。

在认知协作模式下，AI不再是黑盒工具，而是透明的思维伙伴。当用户请求分析情感趋势时，AI会实时展示其思考过程：“正在分析数据结构…发现时间模式…识别到情感下降趋势…建议深入分析原因”。用户可以在AI思考的任何节点进行干预，提供战略指导或纠正方向。更重要的是，系统具备细粒度交互能力，用户可以针对任何特定元素进行精确调整，而不必重新开始整个流程。Software 3.5还具备自适应学习能力，通过持续的交互历史学习用户的认知模式和偏好，逐步建立真正的智能伙伴关系。

这种认知协作模式实现了“交互即智能”的理念，人机双方的智慧在实时交互中涌现和放大，产生单独任何一方都无法达到的效果。虽然技术复杂度较高，但我们的实证研究表明，这种模式在用户体验和问题解决能力上都实现了代际性的突破。

Software 3.5: 为什么是现在？

Software 3.5之所以在此时提出，并非偶然的概念创新，而是源于一个历史性的技术突破：大模型通过Inference-time scaling训练，具备深度思考的能力，人类首次能够与AI进行真正的思维层面交流。

这个突破标志着我们进入了“大模型第二幕”——从简单的能力涌现跃升到深度的认知对齐。在第一幕中，我们见证了GPT、ChatGPT等模型展现出惊人的生成能力，但它们本质上仍是“高级的模式匹配器”。而第二幕的到来，以OpenAI的o1系列和DeepSeek的R1模型为代表，AI开始展现出真正的推理能力、元认知意识和自我反思能力。

更关键的是，这些模型不仅能理解人类的指令，更能理解指令背后的深层动机、上下文假设和未明言的期待。当AI能够进行假设推理、提出反问、主动澄清歧义时，传统的“输入-输出”模式就显得极其原始。这种思维层面的交流能力为Software 3.5的认知协作模式提供了坚实的技术基础。

思维层面交流的出现彻底改变了人机合作的可能性边界。在传统模式下，人类必须承担“微观管理者”的角色，事无巨细地指导AI的每一个步骤。而在认知协作模式下，人类可以转变为“战略指导者”，只需在关键的认知决策节点进行干预。AI能够自主进行大量的信息搜集、模式识别和初步分析工作，然后在遇到需要人类判断的关键点时主动寻求认知输入。

更令人兴奋的是，这种合作模式支持异步协作：AI可以在人类离线时继续思考和探索，当发现重要发现或遇到决策分歧时，会智能地选择合适的时机向人类反馈。同时，认知状态的可视化让人类能够真正“看到”AI在思考什么——不只是最终结论，而是整个推理链条、假设验证过程和不确定性评估。这种透明性不仅增强了信任，更重要的是让人机双方能够在同一个认知框架下协作。

这种全新的合作模式必然催生了界面需求的根本性革命。传统的聊天界面被设计用于简单的问答交互，根本无法承载认知协作的复杂需求。新的界面需要支持多模态认知输入，让用户能够通过文字、图像、语音、甚至思维导图等多种方式表达复杂的认知意图。界面还必须具备上下文感知能力，能够理解用户当前的工作状态、认知负荷和注意力分配，智能地选择合适的时机和方式进行交互。

更重要的是，界面需要提供异步思考空间，支持不同时间维度的思考和反馈——有些认知任务需要即时响应，有些则需要深度思考和反复迭代。正是这些技术条件的成熟汇聚，使得Software 3.5不再是遥远的构想，而是当下可实现的现实。我们正站在一个历史性的拐点上，传统的人机交互模式即将被认知协作模式彻底颠覆。

Software 3.5 时代对开发者提出了什么新的要求？

Software 3.5时代催生了全新的技能需求体系。

首先是认知建模能力：开发者需要理解不同用户群体的认知模式、工作流程和决策习惯，能够将抽象的认知需求转化为具体的交互设计。

其次是意图工程技能：这是prompt工程的高级形态，不仅要会写有效的提示词，更要理解如何构建多层次、多维度的意图表达框架，让AI能够准确理解复杂的人类需求。

上下文工程成为Software 3.5时代的核心技能之一。与传统的简单prompt不同，认知协作需要AI拥有丰富而精确的上下文理解。开发者必须学会构建多维度的上下文架构：包括任务上下文（当前工作的具体目标和约束条件）、用户上下文（用户的专业背景、认知习惯和偏好模式）、历史上下文（之前的交互历史和决策轨迹）、环境上下文（当前的工作环境、时间压力和资源限制）以及认知上下文（用户当前的思维状态、注意力分配和认知负荷）。开发者需要设计智能的上下文管理系统，能够动态收集、更新和提供相关上下文信息，确保AI在每个认知协作节点都能获得充分有效的背景信息。

实时交互设计成为新的核心技能，开发者需要设计出支持认知状态可视化、实时干预、细粒度调整的动态界面。异步协作架构要求开发者理解如何设计系统，让AI能够在后台持续思考，同时在适当时机与人类进行认知同步。最重要的是认知伦理设计，开发者必须考虑如何在放大人类认知能力的同时，避免认知依赖和技能退化。

每个人都能成为认知架构师

从Software 1.0的代码编写，到Software 2.0的模型训练，再到Software 3.0的提示（prompt）工程，现在我们迈向Software 3.5的认知协作时代。

这不仅仅是技术进步，更是对智能本质的重新认识：

智能不是单体的属性，而是交互中涌现的现象
最高级的智能来自人机认知伙伴关系
软件开发将成为人机协作的艺术

未来的软件开发者不仅要掌握传统编程技能，更要成为优秀的认知协作者——知道何时介入、如何引导、怎样与AI建立真正的思维伙伴关系。

正如我们三年前预见了Software 3.0的到来，今天我们坚信：Software 3.5的认知协作时代已经来临。

这将是一个人机智能真正融合的时代，一个交互即智能的时代，一个每个人都能成为认知架构师的时代。

One More Thing

关于“Software 3.0”这还是一个关于“英雄所见略同”的故事：

Andrej Karpathy最近在YC的演讲刷屏了AI圈。看到满屏的转发和讨论，我们既高兴又有些复杂——因为他用来解释Software 3.0的核心例子，几乎就是我们三年前工作的翻版。

同样的情感分类场景，同样的三段式对比，甚至连“I love this movie”这个示例都如出一辙。这种高度的一致性让我们意识到：有些想法的时间真的到了，不同的人会在不同的时刻抓住同样的本质。 Karpathy点燃了这把火，让Software 3.0的概念传播到了更广阔的世界。但火苗，早在三年前就已经闪烁。”

让我们回到2022年。那时还没有ChatGPT、GPT-3 Davinci刚发布，大多数人还在讨论“大模型能做什么”。而我们，也察觉到软件开发正在经历第三次范式革命，Software 3.0时代来临。

我们不仅提出了概念，而且开发了Software 3.0: Promptware开源框架：

完整的“prompt as software”工具链
版本控制、基准测试、调试等基础设施
GitHub最早提交：2022年

附链接：https://github.com/ExpressAI/Promptware

我们还撰写了系统性白皮书（不过没有公开发布），深度分析软件开发生命周期变革，比简单的概念提出更加全面系统。

我们即将发布完整的Software 3.5技术框架白皮书和具体产品实例。这次，我们不仅要定义概念，更要构建完整的认知协作生态系统。

参考文献：
[1] Generative AI Act II: Test Time Scaling Drives Cognition Engineering, Xia et al.2025
[2] Interaction As Intelligence, Ye et al.2025

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

专属AI产品从业者的实名社群，只聊AI产品最落地的真问题

扫码添加小助手，发送「姓名+公司+职位」申请入群～

进群后，你将直接获得：

👉 最新最专业的AI产品信息及分析 🔍

👉 不定期发放的热门产品内测码 🔥

👉 内部专属内容与专业讨论 👂

🌟 点亮星标 🌟

科技前沿进展每日见

（文：量子位）

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

明敏 整理自 凹非寺量子位 | 公众号 QbitAI