智谱 Z1：首款“瞬时模型”发布

人眨了一下眼 —— 约 0.3 秒

东西从茶几上落下 —— 约 0.3 秒

为了严谨，我真的去测算了

然后，视线从键盘移到屏幕 —— 0.3 秒，Z1 已刷屏了回答

也大概是 Z1-AirX 刷屏的时间

当快到这个程度，人是反应不过来的。

这，就是瞬时模型。

首款“瞬时模型”

0.3 秒，是神经反射所需时间，也是人的「瞬间」

Z1-AirX 是首个国内大模型厂商提供的“瞬时模型”，这里有两个指标：

于是，我们见证了一个改变：从“提出问题—等待回应”的线性节奏，变成输入与输出同步发生的即时对话。

R1 vs Z1 速度对比

正常情况下，AI 的响应时间通常在 1～3 秒之间，生成速度约为 20 tokens/s。这意味着，用户在输入结束后，会经历短暂的等待期，模型随后才开始输出。这种延迟在多轮交互中被频繁放大，造成明显的思维中断。

而 Z1-AirX，改变了这种交互：

称 Z1-AirX 为“瞬时模型”，是因为它突破了“大模型必须等待”的范式，让 AI 节奏真正接近人类。

可以期待，更多模型会跨越这条临界线：真正的智能，不该让人等待

（文：赛博禅心）