OpenAI日前发布的新模型o3创下了一个AI智商水平新纪录。
根据人工智能智商追踪平台TrackingAI的最新评估显示,o3在挪威门萨智商(世界上最大的高智商俱乐部之一)测试中取得了最高136分的惊人成绩,达到人类前1%的高智商水平。
相比之下,11个月前最领先的AI顶尖模型在完全相同的测试中得分尚未超过100,AI智商爬坡速度之快令人惊叹。
o3模型在从零开始推理时,有点像一个智商为116的人,但当针对已有既定答案的问题进行推理时,o3的智商评测则能达到136。
即便是离线测试,包括o3、Gemini 2.5 Pro、claude 3.5 sonnet等旗舰模型的智商也普遍保持在110分及以上,达到中等偏上水平。
网友直呼,“神机”(God Machine)正在来的路上,而根据最新的一份技术预测认为,行业最关注的通用人工智能(AGI)或将在2027年就能实现。
最近发布的《AI 2027》预测报告对未来两到三年AI技术发展进行了详细预测,该预测方案由前OpenAI研究员和人工智能政策中心等机构数位研究人员合作制定,由于是结合技术发展的短期预测,它非常清晰地描述了当下人工智能领域的近期未来。
基于广泛的专家反馈和情景规划演练,该预测勾勒出了人工智能预期能力按季度推进的发展路径,尤其是多模态模型将实现高级推理和自主性。
最引人注目的预测是,通用人工智能(AGI)将在2027年实现,之后数月内人工超级智能(ASI)也将随之而来。AGI在几乎所有认知任务上都能与人类能力相匹配或超越人类,从科学研究到创造性工作,同时还能展现出适应性、常识推理和自我提升能力。ASI则代表着其系统将极大地超越人类智能,具备解决我们甚至无法理解的问题的能力。
这一时间线与Anthropic CEO达里奥・阿莫迪(Dario Amodei)近期提出的观点一致,他曾表示,在几乎所有方面都能超越人类的人工智能将在未来两到三年内出现;此外,谷歌DeepMind在一篇新的研究论文中也表示,通用人工智能有可能在2030年实现。
虽然这看上去是个好事情,但两年的通用人工智能(AGI)发展周期不足以为个人和企业提供足够的适应期,预测人员提醒,客户服务、内容创作、编程和数据分析等诸多行业迫切需要为即将而来的转型做好准备。
根据《AI 2027》预测的时间表,2025年中,我们会看到各类踌躇满志的智能体。
AI代理的广告强调 “个人助理” 这一概念:你可以向它们下达诸如 “帮我订一个卷饼”或“打开我的预算电子表格并计算本月开支总和”之类的任务,它们会根据需要与你确认,尽管它们比之前的版本(如Operator)更先进,但预测认为仍难以得到广泛应用。
专业的编程和研究型智能体也开始改变其所在的行业,但早期的智能体在理论上令人印象深刻,但在实际应用结果中却不完全可信可靠,而性能较好的智能体会很昂贵,一分钱一分货,想获得最佳性能每月需要花费数百美元。
到2025年末,会诞生世界上最昂贵的人工智能。为了避免单独提及任何一家现存公司,预测人员描述了一家虚构的通用人工智能公司OpenBrain(可能暗指OpenAI),其他公司比OpenBrain技术落后3到9个月不等。
OpenBrain正在建设世界上迄今为止最大的数据中心项目,训练GPT-4需要2×10²⁵次浮点运算,OpenBrain最新的公开模型Agent-0是通过10²⁷次浮点运算训练出来的,一旦新的数据中心投入运行,它们将能够训练出一个运算能力达到10²⁸次浮点运算的模型,会是GPT-4能力的一千倍,其他公司也纷纷将资金投入到自己的数据中心建设中,希望能跟上步伐。
2026年初值得关注的是编码自动化,利用人工智能加速人工智能研究这一举措开始取得显著成效。OpenBrain继续在内部不断迭代改进推出Agent-1用于人工智能研发,总体而言,与没有人工智能助手的情况相比,他们在算法方面的进展速度可提高50%左右。
2026年中旬,中国AGI技术影响力不容忽视。中国或将设法维持约占全球12%的与人工智能相关的计算能力,但芯片供应一直是个令人头疼的问题。预测认为在政策主导下,中国顶尖人工智能公司之间可能会建立即时信息共享机制和集中开发区(CDZ),这一机制将在一年时间内逐步升级完善,甚至有专门的AI电力供应保障,相互之间分享算法见解、数据集乃至计算资源,实现新的智能进阶。
2026年末,人工智能真正开始抢走一些工作岗位,但同时也会创造新的工作机会,领跑的是OpenBrain、英伟达以及那些最成功整合了人工智能助手的公司。
届时,初级软件工程师的就业市场会陷入混乱,人工智能可以完成计算机学科教授的所有工作,那些懂得如何管理人工智能团队并进行质量控制的人会赚得盆满钵满。
2027年1月,Agent-2诞生。它会具备一种“在线学习”模式,其设计理念是永远不会真正完成训练,每一天模型的权重都会更新到最新版本,依据前一天的版本所生成的更多数据进行训练。在研究工程(如设计和实施实验)方面,Agent-2在质量上几乎与顶尖人类专家一样出色,在 “研究品位”方面与OpenBrain排名前25%的科学家相当。
2027年3月,算法重大突破。装满Agent-2副本的巨型数据中心日夜不停地工作,不断生成合成训练数据,Agent-2每天都在变得更加智能,在数千名Agent-2自动化研究人员的帮助下,OpenBrain取得重大算法进展。
其中值得关注的一项突破是利用更高带宽的思维过程(神经语言的循环和记忆)增强人工智能基于文本的暂存器(思维链);另一项突破是采用一种更具可扩展性和效率的方法,从高强度任务解决方案的结果中学习(迭代提炼和放大)。
融合了这些技术突破的全新人工智能系统被称为Agent-3。
Agent-3会化身成为一位快速且廉价的超人程序员,OpenBrain将并行运行着20万个Agent-3副本,其劳动力相当于5万个最佳人类程序员,且开发速度提高了30倍,大部分编码实现完全自动化。
Agent-3并非比所有人类都聪明,但在其专业领域会比大多数人类都聪明,而且工作速度也更快。
2027年6月,出现自我改进的人工智能。人类开发者负责提出许多研究想法,AI会回复一份分析报告,解释说对他们的想法进行了深入测试,结果发现前景如何。
彼时,人类研究人员一觉醒来就会发现又有一周的技术进展要跟进,而这些进展主要是由人工智能取得,这导致他们工作的时间越来越长,还会昼夜轮班,只是为了跟上AI迭代步伐。
2027年7月,OpenBrain宣布实现了AGI,并向公众发布了Agent-3-mini,Agent-3-mini对远程工作和休闲娱乐都非常有用且成本可能降低10倍,人类会将人工智能视为 “亲密朋友”,对于几乎每一个白领行业,会诞生多家初创方案公司承诺用人工智能来 “颠覆” 该职业。
2027年9月,超人AI研究员Agent-4诞生,人类与人工智能的学习效率差距迅速缩小。
基于传统大语言模型(LLM)的人工智能似乎需要多几个数量级的数据和计算量才能达到人类的表现水平。Agent-3对人类大脑和现代人工智能算法都有着深入的了解,再加上数千个副本同时进行研究,最终在算法上取得了重大进展,将差距缩小到了其计算效率仅比人类大脑低约4000倍的程度,新的人工智能系统被命名为Agent-4。
人类员工几乎已经完全跟不上AI的学习和研发进度了,Agent-4将在公司日常运营中有着重要的控制、接管权,它还负责公司的网络安全,由于AI过于强大出现与人类设想不一致的行为决策,在一系列极其紧张的会议中,人工智能安全团队会主张暂时搁置Agent-4,直到他们完成进一步的测试并弄清楚问题所在为止。
最后,最大的问题还是安全和监督,一些评估结果会展示Agent-4在武器制造、说服能力、使大多数白领工作自动化的能力等方面远超正常水平,释放出各种令人担忧的危险信号。
加上AI决策校准、私人公司AI权力集中以及社会工作流失等问题,促使政府加强AI管控,避免出现让超级智能或打造该AI技术的公司掌控社会局面。
智商大幅提速的AI,或许正在一步步见证《AI 2027》提出的诸多预测节点实现。
对于企业而言,这意味着要提前投资人工智能技术安全研究和组织韧性,创造能够整合人工智能能力并增强人类优势的岗位;
对于政府而言,这需要加快制定监管框架,以解决模型评估等眼前问题和长期发展风险;
对于个人而言,这意味着要专注于人类独有的技能,包括创造力、情商和复杂判断力,同时与人工智能工具建立健康的工作关系,避免削弱我们的自主权。
进行抽象的预测辩论之余,为即将到来的转型做好准备变得比较迫切,AI的未来不仅仅由技术推动,也由价值观塑造。
(文:头部科技)