扩散架构 or「NoThinking」,AI 对话的「1Hz 壁垒」如何突破?

机器之心PRO · 会员通讯 Week 31

— 本周为您解读  个值得细品的 AI & Robotics 业内要事 —

1. 扩散架构 or「NoThinking」,AI 对话的「1Hz 壁垒」如何突破?

Eric Jang 的「智能频谱」如何解释 AI 能力?什么是 AI 的「1Hz 壁垒」? 不同类型的 AI 应用分别需要多快的反映速度?扩散架构和「NoThinking」路线能解锁怎样的速度层级?具备「Ultra Instinct」的智能体需要哪些先决条件?通用智能体为何要具备跨越 0.1Hz – 50Hz 的能力?…

2. Demis Hassabis 深度对话:AI 的瓶颈在于「品味」的缺失?

什么是「可学习自然系统」?物理规律不是非得靠「交互」才能学习?AI 的「品味」缺失如何体现?下一代 AI 最大机会在于构建真正的开放式世界?…


本期完整版通讯含 2 项专题解读 + 30 项 AI & Robotics 赛道要事速递,其中技术方面 8 项,国内方面 14 项,国外方面 8 项。
本期通讯总计 20254 字,可免费试读至 9 % 
 消耗 99 微信豆即可兑换完整本期解读(约合人民币 9.9 元) 


事解读① 扩散架构 or「NoThinking」,AI 对话的「1Hz 壁垒」如何突破?

引言当红通用人形机器人公司 1X 的 AI 副总裁 Eric Jang 近期撰文提出了「智能频谱」的概念,并阐述了当前 AI 面临的「1Hz 壁垒」,以及实现 AI「Ultra Instinct」能力的先决条件。在「智能频谱」的视角下,诸如扩散 LLM 和「Nothinking」推理方法等近期提出的推理方案似乎有望解决 AI 的一部分窘境,但未来真正就被「跨频谱」能力的通用智能体仍存在系统性的瓶颈。


真正的智能要跨越「1Hz 壁垒」?[1-1]

1、人形机器人创企 1X 的 AI 副总裁 Eric Jang 近日发布博文《Ultra Instinct》,提出了「智能频谱」(Intelligence Spectrum)的概念,将不同类型的智能决策过程类比于电磁波谱,涵盖了不同的时间尺度上发生的各种智能行为。

① 智能频谱的一端是「极慢的智能」。Jang 以植物的生长为例,表示它们的「决策」(如向光生长、根系扩展)以极慢的频率发生,以至于人类的时间感知不会将其视为智能,但这背后存在清晰的、含有目的策略性行为。

② 在频谱另一端「极快的智能」对应频率极高的决策行为,如人类在翻书时,手指施加的力量和摩擦力的精细控制;或是蜂鸟每秒扇动数十次翅膀以悬停在空中的精准操作。这些决策的频率高到人类无法有意识察觉其过程。

③ Jang 通过智能频谱阐述的理念在于,智能并非一个单一的、绝对的概念,而是分布在不同时间频率上的连续体。从宏观的战略规划到微观的瞬时反应,都是智能的不同表现形式。

2、在智能频谱概念的概念的指导下,Jang 根据对现有 LLM 性能的计算和量化分析,将 ChatGPT 和 Llama 等当前主流 AI 聊天助手比喻为「1-2Hz 的智能」。

① 目前,顶级的 LLM 从接收用户输入到生成第一个有效词元(Token)的响应时间(Time to First Token, TTFT)普遍在 200 到 500 毫秒之间。

② 如果考虑到生成完整句子的时间,LLMs 的整体交互频率便会降低到 1-2Hz 左右。虽然这个速度很快,但与人类自然、流畅的对话节奏(约为 10Hz)相比,仍然存在明显的差距。

3、Jang 表示,「1-2Hz 的智能」反映了 AI 与人类反应速度的不匹配,这导致当前几乎所有的 AI 交互都被困在一种「回合制」的情景里。人类用户必须主动「放慢速度」,等待 AI 完成它的「回合」,才能进行下一步。

① 更严重的问题在于,这种延迟加剧了 AI 在更深层次认知能力上的局限。AI 现存的幻觉问题、对复杂上下文和人类真实意图的理解偏差,以及缺乏主动性和情景感知能力等问题,都在这种非实时的交互中被放大。

4、参考人类对未来通用智能体的期待,不论是聊天对话还是在物理载体中实现一种自然、无缝的互动方式,突破「1Hz 壁垒」的意义不会是仅追求更快的速度或更低的延迟,而是实现 AI 质变的先决条件。

① 在此基础上,Eric Jang 强调,从缓慢的战略规划(0.1Hz),到流畅的日常对话(10Hz),再到高超的瞬时反应(50Hz),一个真正的通用人工智能必须能够覆盖整个智能频谱。

② Jang 故而作出了一个大胆的预测:未来,任何不能在 0.1 赫兹到 50 赫兹的广泛决策频率范围内(无论是实体的还是数字的)做出智能反应的东西,都会被视为「不完整的通用人工智能」(Incomplete AGI)。


双系统理论如何映射智能频谱下的速度层级?

1、Eric Jang 在讨论智能频谱时用不同类型决策频率指标解释各类 AI 应用的需求,同时反映了当前不存在一种普适的 AI「速度」。

2、决策频率的需求差异反映了不同的应用场景对底层系统架构提出了根本不同,甚至相互冲突的速度要求。这种速度需求同样在 Daniel Kahneman 提出的双系统理论(Dual Process Theory,快思考的系统 1 和慢思考的系统 2)中映射。

(文:机器之心)

发表评论