AI上清北,普通人该怎么办?|

在这个时代重新理解教育和人类的价值


作者|张一甲、张鹏、潘乱
整理|沈伊人


2025 年,大模型又一次刷新了人类的认知边界,AI 模拟高考成绩大幅跃升,已达到清华、北大的录取线。但另一方面,这也让人感到些许焦虑。


如果 AI 都能考上清北了,那人类的努力还有什么意义?我们又该如何继续创造价值?这是一个不小的命题。


7 月 3 日,极客公园创始人&总裁张鹏、「乱翻书」主理人潘乱、甲子光年创始人兼CEO 张一甲,三位长期关注 AI 行业的观察者,换了个视角,不谈参数、不谈迭代,而是从人的角度、社会的角度,回到每一个个体的现实处境中,从“AI 考上清北”这一热点现象出发,就 AI 与教育这一议题展开对谈。


  • AI 的能力在过去一年,产生了怎样的变化?

  • AI 应用带来了怎样的机遇?

  • 我们又应该如何在这个时代重新理解教育和人类的价值?


这个话题听起来或许有些沉重,但我们希望以轻松的方式聊出一些希望。


以下是这场对谈的实录,希望能为你带来思考与启发。

 



1.AI高考成绩背后

大模型能力在过去一年的进步


AI高考


张鹏:我们先从最近 AI 模拟高考的成绩说起。不知道你们有没有注意到,大模型最近又考了一次高考,分数涨得特别快。2024 年测试的时候,AI 能够考上一本了,而 2025 年的测试,AI 能够考上清北了。字节的模型,一下子涨了 150 分,都快够上北大清华的线了。你们听到这个消息时,感觉怎么样?会觉得意外吗?


潘乱:如果是第一次看到这个新闻,我肯定会很意外。但其实这之前已经有不少铺垫了,比如志愿模拟、做题测试等等。要是放在两三年前,大家可能会觉得震惊,但现在 AI 已经普及了一段时间了,很多人可能都会觉得很厉害,但也在预期之中。可能大家没想到会这么快。但基于 AI 一直以来在逻辑和知识上的积累,它本来就在这方面有优势。


张鹏:我能感觉出来,你现在已经完全对 AI 不设防了。你觉得它能做到这件事是迟早的事,无非就是今年还是明年而已那我想听听一甲怎么想的。毕竟你是北大的学霸,而且数学是特长,你听到 AI 考到你当年那个水平,有没有觉得被“冒犯”到?


张一甲:说实话,没有被冒犯(笑)。因为我其实没参加过高考,当年是通过数学奥赛提前拿到了北大数学系的录取通知。所以在这个话题上,我多少有点“班门弄斧”,但可以试着聊聊。


今年 AI 的高考分数出来时,我其实更震惊的是,真人考生的分数也很高。不知道你们有没有注意到,很多省市 700 分以上的人数特别多。我去查了一下,可能跟新高考制度,比如“赋分制”有关。但总的来说,真人的能力也在变强,竞争越来越激烈。


至于 AI,我和潘乱看法差不多。这是一个必然现象。高考其实是非常适配大模型能力的场景:结构化强、逻辑链清晰、题库干净、垂直度高,非常适合 AI 发挥。而且它有巨大的社会关注度,自然成了大模型的一个理想试炼场。今年模型进步快,考生成绩也好,在我看来是可以预期的。


张鹏:对,其实你想想看,高考最终是一个打分体系,尤其像数学这种偏理科的科目,模型在这方面的“天赋”本身就比人更强。它训练的数据量更大,逻辑计算也更精准,再加上强化学习,很多能力都能对齐,甚至超越人类。


张一甲:我先回应一下刚才张鹏说的。其实从早期的生成式模型,到现在推理能力大幅增强的模型,发展是非常明显的。原本我们觉得文科更适合大模型,但现在 AI 在理科上的表现更强,原因就在于它的深度推理能力优化得特别快。这其实是认知结构范式的一次跃迁。所以在理工科领域,大模型未来一定还有更大的发挥空间。


张鹏:对,今年高考数学 AI 的得分好像已经突破 140 了,满分 150,基本就是顶尖水平了。是不是可以说,在数学这个领域,大模型已经接近人类满分水平了?这也因为数学是个封闭的体系,可以通过强化学习反复训练。那你们觉得,大模型能拿高分,是因为它真的“聪明”,还是因为它会刷题?毕竟它特别适合刷题。


潘乱:这个让我想到当年的 AlphaGo,一开始它也是靠不断练棋谱。大模型的早期,可能也得靠“刷题”,比如把“5 年高考 3 年模拟”全做一遍。人类学生一周能刷几套题,它一天能做完过去几十年的题库。所以它可以模仿人类的学习路径。再进一步,它甚至可以像 AlphaGo 那样,自我对弈、自我进化。这个过程其实是非常快的。


张鹏:是的,高考数学题对 AI 来说可能都太简单了。我们看到它拿到 140 多分,那它和人的数学能力相比,到底差在哪?因为从分数看,已经很接近人类顶峰水平了。


张一甲:首先,人类的数学能力和高考数学其实是两个完全不同的概念。高考属于初等数学,高考成绩更像是一种训练结果。说白了,我们不需要太多地去思考“为什么”,只要掌握足够多的方法和定理,多刷题,成绩自然就能提高。


刚才潘乱也提到,AI 实际上就是在加速这个过程。它没有人的精力限制,可以刷最多的题、读最多的资料,在一个有特定的数据库,又结构化、依赖逻辑和套路的环境下,高考数学对 AI 来说根本不是难题。


但如果我们往前推,在人类数学这条长轴上进入高等数学领域,那就完全不一样了。高等数学需要非常强的抽象思维能力,对复杂概念的理解能力,最重要的是,可能你随着从本科到研究生到博士,你要定义一个问题。那你定义这个问题的能力很多时候依赖的是一种“直觉”,甚至是一种“审美”。这类能力是题海战术无法培养出来的。


举个例子。当年我们一起参加数学竞赛的一个朋友,后来去了哈佛读数学博士。有一次我问她:“你的研究方向,全世界大概有多少人能看懂?”她说不到 20 个。


在这么窄的领域里,不可能有成熟的数据,甚至连现成的方法都没有。她需要自己定义问题、定义工具,才能把研究往前推进一步。更别说数学作为一个几千年历史的学科,光是“爬上巨人的肩膀”都可能耗尽一生。所以我一直对数学家充满敬意。


张鹏:我其实挺好奇的。一甲当年打奥赛成绩很好,直接保送北大。那像你刚才说的,从学生一路走到数学家的那个“象限”,人是怎么修炼出来的?这种能力是天生的,还是可以通过训练或某种机制被激发?如果说大模型是靠数据驱动的,那人类在这条路上靠的又是什么?


张一甲:说实话,走数学竞赛这条路,大概可以分成两类人:一类是“科班出身”的种子选手,比如人大附这种名校,从小就有顶级教练,甚至国家级的资源带着他们系统训练;另一类就是像我这样的“野路子”。


我可能花三个月苦思冥想才琢磨出一个方法,他们的教练可能一个下午就讲完了。如果你当成竞赛来训练,其实是有一整套成熟方法论的,前人的经验会在一开始就“喂”给你,像是模型一出生就 train 得很好,带着预设知识和套路。而我这种“野路子”,更多靠的是兴趣、天赋和直觉。


比如看到一道抽象题,我可能没学过太高级的方法,但会直觉地想到是不是该补一条辅助线,或者换个解法。这种感觉很难用语言清晰描述,但确实是有些“非标准路径”的认知方式。所以说,不同的人有不同的成长路径,可能也需要不同的培养方式。


张鹏:“科班出身”的选手,其实就是从小被训练,在大脑中早早植入方法论,沿着这些思路去延展和突破。而一甲你这种“野生型”的,更像是人类内部的“涌现”现象,可能某种程度上是天赋或基因驱动的。模型是基于数据的涌现,你这种或许可以说是人类里的“基因涌现”。


潘乱:那如果再说回考试,比如高考,虽然你没参加过。但我们可以认为,高考这种考试,是有方法可循的。加上勤奋训练,大概率能搞定。毕竟中国这么多年,绝大多数人都是靠这个路径走出来的。但如果说要成为数学家,那就不是光靠方法了,可能天赋也很关键。


张一甲:我觉得不能简单归结为“方法”或“天赋”。更重要的是你对这件事有没有一种沉浸式的痴迷和好奇心。比如北大数学系的韦东奕,他完全沉浸在自己的数学世界,外界的声音对他几乎是无感的。这种专注力和驱动力,才是最核心的东西。


而且像高考数学或者初级竞赛,更多是限定时间内完成足够多的题,强调答题效率和准确率。但到了像中国数学奥林匹克这种级别,一场考试 4 个半小时、三道题,两天六道题。时间是充裕的,关键是你能不能真正“解”出这些题。一道题你会就是会,不会真的就是不会。这个阶段考察的是你沉浸研究一个问题的能力,它和高考那种快速反应、程式化训练就完全不一样了。


推理能力提升


张鹏:一甲这个描述很好地回应了我们一开始的问题:今天 AI 在数学考试里拿到了很高的分,已经超过了大部分人类,甚至接近顶尖水平。但如果我们讲的是“成为数学家”,你会发现,光有天赋或勤奋还不够,最核心的是motivation,也就是内在驱动力。


很多领域的顶尖人物,真正拉开差距的是他们内在的动力。而这正是目前 AI 无法具备的东西。它是被动“召唤”出来执行任务,它没有自己的动机。至少现在的模型还做不到自我驱动。所以在这一点上,AI 和人类之间仍有根本的差异。当然未来会不会有变化,我们可以继续观察。


那我们不妨接着往下聊,刚才说了理科、数学。一甲其实也提到过,这几年大模型最大的突破,其实就是在推理能力上的跃升。


我想先问问潘乱你有没有明显感受到这几年大模型推理能力提升后,不管是你用到的产品,还是你和 AI 之间的互动方式,有什么变化?说说你的亲身体验。


潘乱:影响很大,几乎方方面面。我举个最生活化的例子:我前阵子在东京上野公园的国家博物馆,耳朵上戴着字节出的Ola智能体耳机。看到一个日文雕塑看不懂,我就直接问耳机“这是谁?”它立刻就能给我讲清楚。这种无缝的信息获取体验已经成了我的日常。比如我骑电动车时不方便掏手机,就直接问它各种事,有事没事都问几句。


在工作上,AI 也带来了很多改变。过去半年,我感觉自己变得更“勤奋”了。这种勤奋不仅是做得更多,也是在工作内容上有了更多发散。不同产品的表现也不一样,比如年初让我震撼的是 DeepSeek;后来Claude、ChatGPT、豆包、元宝等都在这半年里进步飞快。


就比如,以前整理访谈速记非常痛苦,现在用Claude,像我们今天直播完,10 分钟内它就能帮我校对错字、加小标题、提炼结构,虽然还要修改,但已经非常高效了。还有像豆包和元宝,我会给它一个大方向、几个零散的想法,让它帮我串起来,做出提纲。


现在我还在写两本书,一本是小说,一本是网络小说。比如网络小说,我会先问豆包、元宝,然后再拿去问 GPT。像我写了一版以东吴孙权为主视角的小说,我让模型整理孙权和四大都督的主线、再加上孙尚香、吴国太、步练师、大乔小乔等人的情感线,还融入曹魏和蜀汉的故事背景。我还让它模仿《汉武大帝》这种历史剧的结构,聚焦哪些关键节点。模型一下子就能生成大量内容。我拿去给一位编剧朋友和导演朋友看,他们都惊掉了,甚至开始质疑自己的职业定位。


张鹏:你这太坏了,不光提升了自己效率,还摧毁了别人饭碗。我记得当年刚认识你时,问过你为什么公众号更新不稳定,你说你喜欢交流、信息量大,但最难的是整理内容。现在 AI 显然把你从这件事里彻底解放出来了。不但公众号更新频率上来了,还有精力去搞小说、搞虚构、搞全新视角,确实能看出你整个状态不一样了。


我想顺着问问一甲。你肯定也在用 AI,但你同时也在观察更广的行业场景,比如企业、组织、团队,特别是新一代的创业公司。很多人其实已经把 AI 嵌入到了日常工作流里。从你的观察看,当推理能力显著增强后,AI 在这些实际应用中产生的价值是不是也显著放大了?你觉得主要在哪些方向体现得最明显?


张一甲:我觉得推理能力的增强,对我们这种类型的工作确实是帮助很大。鹏总的信息源可能更多来自人脉和交流,而我过去是靠大量研究、跟人聊天,现在发现我的交流对象越来越多是 AI。我的面对面交流少了,但学习一个新领域知识的效率反而变高了。


真的,我感觉自己从 E 人变成了 I 人。因为现在很多时候,AI 给出的信息质量和思维过程,其实比我身边的人更有帮助。一方面,它知识广、反馈快,节省了我找资料的时间;另一方面,它的推理过程也帮我理解问题,不只是看结果,而是看它“是怎么想的”。这件事本身就很有启发。


潘乱:我特别同意。在正式工作流里,我现在最常用的是两个产品,一个是飞书的“知识问答”,另一个是 Google 推出的 NotebookLM。我觉得这俩就是给人的大脑装上外挂,甚至可以说是“作弊器”。


张一甲:刚才鹏总还问到 AI 更广泛的行业嵌入。目前来看,AI 正在逐步进入 B 端企业的实际工作流,但这才刚开始。这件事不仅仅需要技术背景的人,也需要懂行业背景的人来推动。因为每个行业的流程不同,容错率、合规性、安全性、ROI 都是关键因素。譬如说有的行业它的容错率非常低,这就需要有很基础的安全保障。AI 要真正落地,需要理解行业的运行机制,这有点像是数字化转型的“下一阶段”。但从整个从 B 端来讲,商业模式上现在还没有出现真正跳脱式的颠覆打法。


多模态突破


张鹏:你看,话题已经聊到了“怎么赚钱”上了。我们已经能看到,它在商业和企业效率提升上的应用已经在广泛展开,而且成效显著。过去这两年,推理能力的跃升,确实让今天的 AI 和当年我们刚见到 ChatGPT 时完全不一样了,已经发生了本质性的进化。


除了推理能力,多模态也是近两年 AI 的一个重要突破。今年高考我特别留意了一类题目——有图的题。过去几年大模型一碰到图形题基本就挂了,今年虽然还算不上优秀,但进步已经非常明显。这一点特别有意思。


你会发现,高考中的图题,某种程度上反映了模型多模态能力的进展。因为没有足够强的推理能力,数学肯定考不好,但图题这种事又不仅仅是逻辑,还得靠模型的多模态能力。一甲你应该很有感受,你最近在关注的圈子里,多模态的发展是不是也进入了一个加速期?你怎么看未来这一块的发展?


张一甲:我觉得是的,多模态基本已经成了所有 AI 公司必须具备的底层能力。它的本质是把人和机器之间的交互门槛拉低了。过去的大模型,prompt 要写得好,才能得到好答案,一般人如果不会提问,效果就很差。但现在因为模型的推理能力增强了,即使你的问题不完美,它也可以引导你怎么去提一个更好的问题。


但这仍然是基于文本交互的。多模态的意义在于,不再是只有文本,图像甚至是视频,也能成为模型理解世界的输入方式。不再要求人类必须把一切抽象成语言。你看今年高考里,像生物、化学这种题很多就是图表题。过去模型理解题意本身就很吃力,现在它在图表上的理解能力提升了,分数能上来也就顺理成章了。


张鹏:多模态也是今年高考反映出的一个重要进展点。潘乱你平时在使用大模型时,有没有感受到多模态能力提升带来的变化?


潘乱:有啊,挺明显的。比如前几天小米发布会,雷总讲车之前还介绍了小米眼镜,这些设备就体现了多模态能力的增强。还有像 NotebookLM,它能把 YouTube 视频的音频转成文字,再翻译成中文,本质上就是一次多模态的链式转换。


再比如识图,现在几乎是所有 AI 产品都在发力的方向。五年前淘宝就说他们搜图是市场第一,很多人拍个图就能搜同款。十年前微软也出过“识花”,帮你识别植物。但现在,这类识别已经扩展到几乎所有物体,甚至可以帮你认路、识别环境。


我最近一个人去旅游,语言不通,但完全没焦虑。我觉得未来再往前推进一步,我甚至都不用读懂路标或听懂外语,只要打开一个 AI 产品,打开实时通话功能,它就能帮我理解身边的一切。其实很多场景,比如同声翻译,今天已经做得相当不错了。


张鹏:你看,以前我们出去旅游还有个动力是“怎么也得学两句外语”。但现在,像潘乱这样直接就没有这个动力了,因为口袋里揣着手机,手机连着 AI、大模型,去哪都不怕。各种语言、各种模态它都能处理。其实从终局看,大模型就像一个模态转换的魔法盒。你把任何东西扔进去,文字、图像、声音甚至视频,它都能识别,然后输出你想要的结果,不管是哪种模态。


潘乱:对,我觉得现在很多领域都在用新技术推进,比如教育。AI火起来之前,其实在线教育已经很热门了,吸引了很多玩家。你看像作业帮的“拍照搜题”,其实就很像是早期的多模态AI了,虽然能力还没现在这么强。现在的AI不仅能拍照搜题、找同款、翻译,还能渗透到生活的方方面面。


张鹏:是的,最大的不同在于现在的AI具备通用能力,而且可以在各种模态间原生转化。理解和生成都更自然,这是AI带来的巨大飞跃。我最近在刷短视频,已经有很多AI生成的内容,占了我视频流的大概15%。你有没有感觉,AI已经在根本性地改变短视频内容了?


潘乱:确实。其实从剪映时代、抖音做模板开始,变化就已经很明显了。现在像剪映、即梦、GPT……甚至能做出带声音的内容。我最近看到很多人用AI做拿刀去切各种东西的视频,比如玻璃水果,还用AI加了拟音效果,很有趣。我的朋友还做了一个“AI Talk”,让乔布斯和爱因斯坦对话。


我特别关注“苏超”,现在已经不仅火在江苏了。很多文旅部门其实是最早、最勤快使用AI的一群人,不光愿意花钱,还愿意主动尝试。像最近江苏搞足球联赛,各地文旅号纷纷用AI做视频,什么“太湖三傻”“徐州大战南京”“真假美猴王”层出不穷。你要我随便说个AI热点,我脑子里想到的就是苏超。我感觉他们发的视频里有一半以上都是AI做的。


张鹏:一甲,你对国内做视频模型和生成产品的团队挺熟的吧?你是不是也觉得,现在他们的内容已经很广泛地出现在我们日常刷到的视频里了?我最近刷到一些AI视频,让我觉得很 amazing,一看就是AI做的,但我不排斥它。


张一甲:我还没到这个阶段。如果这个视频AI感很重,你还会很沉浸地看它吗?


张鹏:我现在已经开始接受了。我在抖音上刷到一个账号,会用AI介绍各种猫狗品种。内容从图像到配乐全是AI做的,编排也很好,还用英文唱歌介绍学名。我知道是AI生成的,但觉得有趣又长知识,画面又特别萌,就很愿意看。以前看到AI内容会觉得套路感太强、没意思。现在已经不一样了,内容发散了,交付质量也更高。你和这些做视频生成的团队聊过吗?他们是不是最近也在加速发展?


张一甲:是的。现在是大模型的底层能力在进步,水涨船高,谁先做出一点新东西,别人很快就能跟上。但我个人刷到的AI内容比例不高,可能推荐算法不同。我现在有点“逆反心理”,AI内容太多的话,我反而更想看真人内容,哪怕是粗糙的。我刚开始会很喜欢AI生成的图、视频、音乐,但看久了就失去审美兴趣。现在我反而更爱看真人综艺、真人秀。


张鹏:哈哈,你看我们俩刚好相反。你刚才说,有了AI之后,很多研究可以不必依赖人与人的交流,效率和质量还更高。我虽然喜欢和AI合作,但我还是更enjoy和人聊天、碰撞的感觉。不过在视频领域,我是很开放的。只要作品好,哪怕是AI做的,也依然打动我。


我觉得关键还是在于内容背后有没有“灵魂”。不管是真人还是AI,只要它能打动你,激发你、让你觉得有趣,本质上都是在追寻那个“有表达的灵魂”。


潘乱:说到底就是表达。我举个例子,大家现在都刷抖音,但你们知道抖音出来之前,全球最流行的短视频形式是什么吗?其实就是MV。抖音本质上也还是MV——音乐加画面。在它流行之前,最流行的短视频是“图片PPT加BGM”。像我们80后大学毕业时,最流行的就是把四年的照片做成幻灯片,加上《青春纪念册》。虽然只是轮播图,但它承载的是情感和表达。


张鹏:你这么一说我想起来了,2010年极客公园第一次做创新产品评选时,我剪了一个MV,把50个产品的logo配上音乐。那时候这些创业团队还很小没人帮他们做,我就自己剪了个视频,现场放的时候,大家眼里都放光了。我觉得这是内容带来的情感连接。今天我们借助AI,能把这种内容做得更丰富。


潘乱:有一个点就是真实,比如让老照片“动起来”这件事,在老年用户中付费意愿特别强。只需要一张照片,就能做出几秒钟的动态,很多人都会被打动。


张鹏:我发现现在每年大模型都像是在“考一次高考”。今年我们注意到,大模型在视频理解类题目上的表现还不太行。不一定是高考,但很多学校考试会用到,比如听一段音频,看一段视频后作答。这类题目,大模型基本都应付不过来。我不知道你怎么看,为什么模型在视频理解上这么难突破?


张一甲:视频其实就是一连串的图像帧,数据量巨大,对算力要求非常高。而且还涉及长时记忆、多模态对齐等复杂问题,远比处理图片难得多。我记得Sora刚发布时,我看他们的论文,最让我印象深的是怎么把视频tokenize,也就是把高维的图像数据变成LLM可以处理的token。这个过程比后面的训练还费劲。视频对模型来说,认知成本和处理难度都是最高的。


张鹏:潘乱,你有没有注意到,模型在视频理解这块还是有些短板?


潘乱:最简单的看法就是看文件大小。视频是几百兆,图片几兆,压缩后可能只有几百KB,文字连KB都用不上。处理成本的差距就是这么大。


当然,除了模态本身复杂,我觉得根本原因还是算力的问题。但平台也在进步,比如抖音、YouTube、视频号,它们在各自生态内都有提升。比如我刚才说的NotebookLM,就能把YouTube视频里的内容抓下来,先提取音频,再做语种转换和语义理解。抖音也在推AI版抖音,微信里还能加“元宝”这个AI助手。现在我刷到长视频,还会丢给AI来帮我解读。


张鹏:我最近和搞技术的朋友聊到视频理解这个问题,发现视频比图像和文本更容易出现“幻觉”。他们提到两个关键点:


第一是“注意力漂移”。视频是连续的内容,模型每一步都是基于概率的预测,注意力机制如果发生偏移,整个模型就会跑偏。大模型的核心机制就是注意力,一旦漂移,就容易产生连锁幻觉。


第二个是“连续性理解”。视频不仅要处理空间信息,还得理解时间线。现在模型还不具备完整的时空连续理解能力,导致动作逻辑常常断裂,context 不连贯。所以我们会看到动作不自然、顺序错乱。这些看似简单的人类能力,对AI来说其实还很难,需要底层技术和架构的突破。


所以现在这个现象很有意思:我们看图片和视频,觉得差不多,但对模型来说,完全不是一个难度级别的事。


AI创作


张鹏:对,时空线的本质其实是因果链。视频出错往往是因为“倒果为因”,看起来逻辑就乱了。这也说明AI在这一块还有很多不确定性和创新空间。


我们回顾三年前看到ChatGPT、今年年初看到DeepSeek,最开始震撼我们的都是它们在语言文字方面的能力,特别是文风。但有意思的是,今年我们看到AI在理科上的提升非常显著,反而是文科得分没涨多少。这也让我疑惑:为什么AI在理科进步更快,而文科的成长却相对缓慢?潘乱你觉得原因是什么?


潘乱:我之前听一位清华老师说,“文科”这个词的英文是 liberal arts,意思是“自由的艺术”;而理科是“找规律”。理科通常有标准答案,文科更多是关于自由、艺术、发散性思维。


文科讲的是情感、价值观、人与社会的互动,是非结构化、非标准的。而大模型本质上就是在做模式识别和效率优化,它更擅长处理有结构、可量化的问题。就像计算器对比珠心算,它追求的是准确、高效。而文科追求的是温度、表达。你看,现在所有科技公司都在说“我们是有温度的科技公司”,这其实是科技和人文之间的张力。极客公园门口那块牌子就写着“站在科技与人文的十字路口”,这原本就是乔布斯说的。每个象限都有自己的极限,只有结合才可能更完整。


AlphaGo下围棋很厉害,但让它去画画就未必行。尤其是画“鬼”比画“人”难,因为“鬼”这个概念不清楚。文科的难点就在于它牵涉到文化经验、价值判断、情感体验等大量非标准的东西,AI很难完全驾驭。


张鹏:一甲,你怎么看?你在北大,又学数学,这两个方向结合起来,你在科技和人文的理解上可能更有独特视角。我想问的是:为什么现在大模型在理科上进步更快,文科相对慢?换句话说,未来到底应该是学理科还是学文科,在AI面前能留下更多的价值?


张一甲:这种终极的东西本身就是偏文科的东西。先说前面那个问题,数学分不同阶段,如果以高考为节点,大模型特别擅长数学。因为它的数据充分、推理结构清晰,还有统一标准答案,完全符合模型的长项。


文科也有些部分能被模型掌握,比如有明确答案的题。但比如作文就很难,它涉及情感表达、价值立场、社会批判,评价标准都很主观。我自己当过改卷老师,不同老师看同一篇作文,打分可能差异很大。还有阅读理解,作者自己都未必能答出“标准答案”。


张鹏:所以理科更偏向一个确定的、客观的结果,而文科更讲求解释的丰富性。这种丰富不是要收敛,而是开放的。比如语言学,其实很理科化,但文学完全不同,重在一人称体验和情绪表达。模型目前更适合做确定性的事,对解释力丰富的任务反而还不如人。这也挺有意思的。潘乱你经常写东西,你觉得大模型在写作上这些年有进步吗?


潘乱:进步非常大。但我觉得像 DeepSeek 的进展还不够快。刚开始用的时候很惊艳,用久了就觉得更新跟不上了。AI发展太快了。DeepSeek 还是会幻觉,比如讲量子力学和拓扑的段子出现频率太高。


但大模型给我的帮助还是非常大的,尤其是在总结、发散和头脑风暴方面。比如像我们聊完这场,飞书妙记能自动生成会议纪要,极大提升效率。以前整理录音太痛苦了,现在快多了。还有就是你给它一个模糊方向,它能帮你搭出结构、出提纲、写概要,非常管用。


再比如半年前,大家都还在讨论模板化写作。现在我明显感受到模型的推理能力进步了很多。去年底我还经常吐槽它没用,根本不能陪我脑暴。现在不一样了,我几乎把所有 AI 工具都充了会员,每天开着好几个窗口,随时用它们发散想法,组织素材。它作为“头脑风暴搭子”,已经非常合格,但说它能写得多好就夸张了。


而且我发现一个很有趣的现象。很多顶级音乐人团队都在研究怎么用 AI 创作,但没人会公开说自己用过 AI,因为一说就显得廉价。就像一甲说的,有些人对 AI 内容有天然的排斥。尤其在创作圈,用 AI 不丢人,但“被看出来用了 AI”就很掉价。


张鹏:确实,都有“鄙视链”了。那你怎么避免让别人看出来你用了 AI 呢?你天天让 AI 陪你脑暴,总得有方法吧?


潘乱:我觉得要像写程序一样用它。不能让它一口气写整篇文章,那是新手的做法。稍微有经验就会自己搭结构,把它拆成一块块来写。AI 写作的问题是文风太容易识别,它真正的价值还是在发散思维这块。对很多人来说,表达不是难点,难的是“写什么”“怎么写”。我觉得 AI 在这方面可以像“备菜”,你要做一道宫保鸡丁,它能帮你切好料、准备配方,甚至指导你怎么炒,但你要是直接把所有原料丢锅里,那肯定不行,这就显得你没水平了。


张鹏:一甲,你们团队创作也多,你怎么看 AI写作?


张一甲:我们用 AI 更多是用于调研、分析和头脑风暴。但写成文这一步我们非常慎重。就算它写得通顺,但经常有事实错误,缺乏“求真”的精神,容易出问题。所以我们一般不会用它来直接生成文章,而是提高前半段的效率。就像炒菜一样,AI 可以准备食材、给出各种做法,但最后的火候还得靠人。我们这个行业写的内容结构化、知识密度高,AI 帮得上忙;但你要跨到艺术创作领域,依赖 AI 可能就要更审慎。我觉得 AI 是“普惠型工具”,它能提升整个行业的基础水平,但它不能替代真正的专家。


张鹏:我也有个比喻。我觉得 AI 像“金”,人像“玉”。你不能直接甩一坨金子上去,那太粗糙;但如果把金作为外圈框住玉,就是“金镶玉”,能形成支撑与包裹的关系。


AI 能提供结构、逻辑、信息支撑,但核心的价值和判断,还是得靠人。这是我现在一直遵循的方法论。比如写文章,模型能帮你梳理思路、架构甚至总结信息,但最初的问题是谁提的?最终想表达什么立场?这还是人的事。AI 是你背后的支撑,不是替代核心表达的主体。我现在也和潘乱一样,整天和各种 AI 工具脑暴,像一甲说的,有时候不懂就搜索联网,效率确实比以前高很多。但最终还是得把这些东西“变成自己的”。


我们今天聊了一个多小时,从高考分数出发,梳理了近两年 AI 在教育和创作能力上的发展。我觉得下面可以聊更重要的话题了。比如,这场 AI 革命到底会怎么影响我们个人的未来。




2.AI上清北了,人类怎么办?


专业选择


张鹏:从 ChatGPT 火到现在才两年,我脑子里都觉得过去了三年多。DeepSeek 也就出来几个月,潘乱已经开始喊“你进步太慢了”。AI 发展这么快,逼得我们不得不思考:人类接下来该怎么定位?比如一个很现实的问题,现在的孩子,到底该学文科还是理科?潘乱,你有没有朋友问你这事?一甲你更不用说了,肯定经常被咨询。


潘乱:我建议他们学个手艺。因为现在中产岗位,无论文理科,都在被 AI 快速侵蚀,成了最卷的领域。考试改变命运的逻辑还在,但很难转变。结果就是,这条路变成一场无限内卷。但如果你能掌握 AI 暂时做不了的事情,比如做金镶玉、雕刻,那就另说了。


张一甲:你其实是在说,最终人要回到“手艺人”的角色。所有工业化、可复制、方法论化的工作, someday 人都绝对会被 AI 超越。


潘乱:对。尤其是我这种二本出身、来自苏北农村的人,面临现实生存问题的人,没资源、不能犯错,怎么安全地获得收入就是首要问题。所以这建议不一定适合所有人,但确实适合一部分人。


张鹏:我明白了,潘乱是在说在未来什么样的东西才是有人的独特价值的。那一甲呢?有没有人问过你,AI 时代该怎么选专业?


张一甲:有。我当年也纠结过这个问题。清华让我任选专业,反而更迷茫。当时对什么工作、职业、就业完全没有概念。后来一个哥哥建议我,大学四年一定要学最难的,要么数学要么物理。因为毕业后很难再有沉浸式挑战一个难学科的机会。这对专注力、意志力、思维方式都是极大锻炼。我觉得有道理,就选了数学。


至今我给别人的建议也是这样:不要从实用主义出发。一旦以“实用”为出发点,大家都选热门,那只会更卷。而且人和人真的是不一样的。即使分数相同,兴趣、天赋、好奇心也完全不同。未来志愿填报可能会有 AI 甚至基因分析帮你算最优解,但那个“最优”可能不是你真正想做的。


潘乱:是啊,这类问题特别依赖个人的家庭背景、性格,以及兴趣,所以基本上说出任何一个答案都是错的。


张鹏:说到底,家长更该关心孩子自己想学什么。motivation 是人类最后的阵地,AI 没法拥有原生的热爱。围着兴趣走,大概率能走得更远。


还有一点,要早点让 AI 参与到孩子的学习里。就像你们刚才说的,AI 能大大提升效率。这个效率是所谓学习的效率,但不等同于拿高分的效率,是更好地探索兴趣的效率。今天喜欢一个方向,明天试试另一个。以前一生换三次方向,现在可能三个月换三次,效率就是被 AI 推上去的。


潘乱:这个前提是孩子不仅仅是为了谋生,而是思考怎么过好这一生。我之前和一个教育公司创始人聊过,聊到教育的本质到底是啥?其实是“实现人的自我发展”。但现实里大家只强调“发展”,几乎忽视了“自我”。


张鹏:确实是,在 AI 越来越强的时代,反而更该关注“自我”。发展拼不过 AI,那我们就做自己。人类未来的使命就是“做人”本身,而不是成为哪个岗位的螺丝钉。AI 会成为全领域的无限供给。既然如此,我们只能在“自我”这块找到不可替代的位置。


潘乱:我现在才真正体会“日新月异”这个词。DeepSeek 才几个月,就已经让我觉得它进步太慢了。但技术进步越快,人类成长反而显得越慢。尤其教育,它的节奏比科技产品要慢得多。更别忘了,学习本来就是痛苦的事。这么多年“快乐学习”从没实现过。真让你学得太快乐,很可能方向就错了。关键还在于批判性、自律、主观能动性,这些比技术更重要。


应试教育


张鹏:那我问个问题:AI 都能上清北了,我们这么多年搞应试教育还有意义吗?AI 一下子超越 99.99% 的人类,那我们以前的这套“苦读”还有必要吗?这可能也会引发一波反思。应试教育到底还有没有价值?


张一甲:我想为应试教育“平个反”。大家提起它总带负面印象,比如死记硬背、题海战术。但其实顶尖的应试选手靠的不是这个。他们训练出来的是系统思维、快速学习能力、专注力和延迟满足。应试教育在高维智力筛选上效率极高。


而且 AI 本身就是应试教育的终极形式。它干的事情,本质上就是应试——标准答案、模式识别、推理。最近 Meta 收了一整个 AI 核心团队,主力成员几乎全是中国人。这些人基本都是应试教育体系下成长起来的,所以我们能看到,最强的 AI 科研团队,大多也是应试教育的产物。应试和 AI 之间不是矛盾,而是高度相关。


张鹏:潘乱你怎么看应试教育?大家现在争议挺大的。


潘乱:我觉得我们刚才说教育的最终目的是“人的自我发展”,这和应试教育是有冲突的。如果我们从“自我”出发,教育就不该只是筛选谁能上大学,而应该培养未来能与 AI 共处的人。所以教育的目标一定要改变。


我是江苏人,我们那中考是硬筛 50%,也就是说有一半孩子直接失去上高中的机会。这些孩子去哪儿?去职高?但今天大部分家长是不敢把孩子送去职高的。这种应试筛选逻辑对社会分配资源确实高效,但牺牲的是大量孩子的发展机会。即便筛出来的那部分人,回头看自己的一生,真的满意吗?


我之前聊过一些人大附中毕业十年的人,他们最终都集中在几个选择上:进大厂、做金融、高薪行业。即使是进了 Meta、OpenAI 的顶尖华人研究员,从更大视角看,这也是一种“优秀的平庸”。当然我这种是属于站着说话不腰疼。


所以我觉得教育的最终目的应当是“自我”比“发展”更重要。当然,应试机制依然有必要,它推动人去学习系统的知识,否则就是一张白纸。就像“人人都是工程师”这种说法,其实你没有产品、设计或编程的基础,用 AI 编程也干不了什么。能不能用好 AI,其实取决于你过往的积累。再比如艺术,你如果没有基本的艺术修养,去了美术馆也只能说“好棒”,找不到别的词表达。你对世界的感知、解读,是建立在“看过世界”的基础上的。中国那句古话,“观千剑而后识器,操千曲而后晓音”,就是这个意思。


所以我们还是需要基础教育,让孩子掌握必要的知识。没有这个过程,哪怕你有 AI,也用不出什么。像把“狼孩”直接放进现代社会,即便给他最好的 AI,也无用。


张一甲:我是觉得潘乱在聊教育这件事情上,感觉比聊科技更有passion。你是不是选错行业了?其实教育比科技难多了。你说教育是为了“自我发展”,可“自我”怎么找到?很多人一辈子也没找到。


我对 AI 的美好期待是:它能提升整体生产力,改善教育资源分配的不平等,比如通过 AI 教师让优质教育更普惠。社会基础能力提升后,我们也许就有更多精力去寻找“自我”,而不是一味“发展”。


潘乱:对,即使是在“发展”这个维度,人也不是纯靠 AI 就能搞定的。比如我们以前带内容团队,觉得靠谱和认真比什么都重要。这种品质靠 AI 是无法取代的。


所以我还是支持应试教育,它让大家系统性地接触不同学科,也促进了逻辑推理能力的形成。而且因为大家都在学校,才能培养人与人沟通的能力。最终我们还是要靠主观能动性、自驱力、终身学习的能力。AI 是工具,但人本身的能力才是关键。未来衡量一个人,也绝不会只看你会不会用 AI 三件套。


教育平等


张鹏:听起来你们俩到后面都有共识了。应试教育是必要的,教育更是必需的。只是未来如何在 AI 时代重构“应试”和“教育”的关系,这是个开放问题。你们支持孩子尽早在学习中使用 AI 吗?


潘乱:我觉得得看年龄段。大学生用 AI 没问题,甚至中学生也可以尝试。但小学生不建议,他们的批判性思维和主观能动性还在发展中,太早依赖 AI 可能有害。五年前拍照搜题就引发过类似讨论,现在国家已经禁止了。学习本身就是痛苦的事,像锻炼肌肉一样需要反复撕裂重塑。如果 AI 把一切都代劳了,学习的真正意义也就没了。


张鹏:对,就像我们坐车代替走路,慢慢丧失了攀爬的能力。未来学习会变得像健身一样,是一件你得主动坚持的事,而不是生活所迫的必要过程。我不知道一甲同不同意这个观点,就是孩子用 AI 这件事要分年龄段,即便用AI,用 AI 的目的要想清楚。


张一甲: 我觉得这个事就没法选择,它一定会发生。你不能阻止小孩接触 AI,你想分年龄段,你分不了的。没有人可以创造一个真空的环境,就像你不能阻止他们上网一样。所以不如正面应对,默认 AI 无处不在,思考“在 AI 环境下,学习到底是什么”。


我认为 AI 在孩子成长中的角色会逐渐进阶,比如说从查词典,到搜索引擎,到 ChatGPT,最终变成思维导师或合作伙伴。所以那个时候它对孩子的学习不再是一种空心化的代替,也许会是一个启发式的提升,这个我觉得是有可能的。


怕就怕在什么地方呢?你看起来在学习,听起来在学习,结果也像是在学习,但可能实际啥都没学进去。你写了一篇文章,但你其实不会写作;你做了一个科幻创意,但思路完全不是你自己的。这才是最可怕的事。所以未来我们更需要用更高标准去判断一个孩子到底学进去了没有。


张鹏:对,今天对于家长们其实是在提出一个空前的挑战。过去只要配合应试教育、照顾好孩子就行了。但今天 AI 加入后,家长需要引导孩子更高效地使用 AI,不是提高“交作业”的效率,而是提升真正的学习质量。教育最终是为了“自我发展”,所以重点在于过程而非结果。家长要转变关注点,不是看孩子有没有交作业,而是了解他是怎么完成的、用 AI 的过程中得到了什么。比如看他是否主动设定了目标、定义了有意义的问题、经历了从发散到收敛的思维过程。这才是教育的价值所在。现在 AI 已经足够强大,结果不难达成,真正重要的是过程中孩子有没有成长。


我再引申一个问题:AI 究竟是促进教育平权,还是制造了新的不平等?以前,小镇青年可以靠勤奋考上名校,改变命运。现在 AI 的普及是不是削弱了努力的价值?潘乱你怎么看,小镇青年未来的机会是变多了还是变少了?


潘乱:我觉得对于主观能动性强的人,AI 会让他们机会更多。但对大多数人来说,数字鸿沟会拉得更大。AI 是个输入输出系统,你得会提问、会使用。可现实是,大多数人连好问题都提不出来,这就造成了严重的能力分层。就像今天,你看抖音的日活是百度的多少倍?很多人没条件去学怎么用 AI,没资源、没人指导,也没有那份主动性。对个别有驱动力的人,AI 是“逆天改命”的机会。但对大多数人来说,现实环境让他们更难跟上。这个差距会越拉越大。


现实中,时间的朋友是懒惰、拖延和健康恶化。你要对抗这些,需要主动去学习、锻炼、克服困难。但这是很难的事情。大多数人并没有那么强的自律,也缺乏一个支持他们成长的环境。所以说,AI 本身是个强大的平权工具,但因为现实世界的不平等,它可能反而会加剧这种差距。


张一甲:这是个很深的问题。我的直觉是:在义务教育阶段,AI 会提升普惠性,比如让偏远地区也能接触到优质教育资源。就像基础医疗,它会随着技术的发展,以边际成本很低的方式去渗透。但往上走,这个事情是真的充满不确定性。


比如现在有算力的公司和没有算力的公司,差距已经很明显了。未来可能变成,可能存在一些高阶的 AI ,被少数人拥有着,但它有着巨大的杠杆效应,以至于这部分少数人可以分配到更多的社会资源,我觉得会存在着这种可能。但这种不平等具体是个什么面貌,我们还没有办法想象出来。这可能就像过去有房和没房的区别。只不过现在我们还不知道未来那个“分水岭”到底会是什么。


张鹏:你说得很关键。这会影响社会中每个人能实现“自我”或“发展”的路径。教育本身也逃不开这个大环境。


张一甲:我还想补充一点,其实教育很大程度上是教人如何适应环境。人类一出生就是早产儿,完全没有生存技能,教育就是帮助个体逐步建立起面对复杂环境的能力。而 AI 的加入,让未来的不确定性更大,所以适应性变得比以往任何时候都更重要。


张鹏:对,AI 带来的不只是技术变革,更是对整个社会结构的重构。不管是生产资料、生产力还是生产关系都在被重新定义。这对追求“稳定路径”的家庭来说,是挑战;但对愿意拥抱不确定性的人来说,也是机会。因为在这种混沌中,会诞生新的力量和路径。谁能在变化中找到自己的定位和意义,将会是关键。以前我们有一个“模板”,未来这个“模板”可能完全不同。


潘乱:所以除了技能、工具、AI,更重要的是人的“靠谱”“认真”“勇气”和“自我驱动”。这些才是更根本的能力,决定你能不能在未来持续迭代、找到自己的位置。AI 是加速器,但能不能用好它,还是看人。


自身定位


张鹏:我们今天其实聊得挺发散,从 AI 考高考聊到教育、公平,还是想从人的视角出发,不谈技术、不谈产品,看看这些变化对我们意味着什么。最后一个问题想请大家从自身出发聊聊:你如何在 AI 时代找到自己的位置?你怎么看待“自我”和“发展”?AI 对你意味着什么?潘乱你先来,你经历了 AI 的发展,也和它频繁协作,现在怎么看你和 AI 的关系?你有没有担心过被替代?


潘乱:AI 对我来说是个很好的工具,它让我变得更勤奋、更深入地使用各种 AI 产品。对我来说,它是协作伙伴,而不是威胁。


张鹏:我再问得直接一点,你真的完全没有被替代的焦虑吗?


潘乱:一丁点儿都没有。有两个原因。


第一,AI 只改变了创作效率,但平台的分发机制、变现模式、受众连接方式这些都没变。今天的创作者仍然依赖已有的内容平台,没有新的流量生态。所以变化的是效率,不是结构。


第二,AI 是工具,关键还是人提出什么问题。你有没有定义问题、驱动问题、结构化解决问题的能力?这才是核心。就像雷军问傅盛,做成 360 安全助手这个事情,你跟周鸿祎谁的功劳更大一点啊?傅盛说是周鸿祎,周鸿祎厉害在于把一个开放性问题变成了可以解决的封闭性问题。


AI 能做的事很多,但你给出的“输入”是关键。人与人之间的输入质量不一样,自然语言是不平等的资源。我现在也在反潮流,比如开始订阅付费杂志,去精进我的输入质量。站在潮流的反方向,可能反而能走得更远。


张鹏:那一甲你怎么看?怎么找到自己在这个 AI 时代的Destiny?


张一甲: 首先我觉得咱们三个都不太会被替代,刚才你说到周鸿祎和傅盛那个例子,我很有感触。我们作为公司的负责人或者 IP 的主理人,是需要在开放世界中定义问题、作出选择,并为此承担风险的。AI 可以执行步骤,但无法回答“为什么做”以及“愿不愿意为这个目标长期坚持”。这些是人类独有的责任感和决心。站在人与 AI 这两个大命题之间,我依然相信人。


时间是熵增的,但生命是熵减的,我觉得生命自有蓬勃之力,即便AI的各个技能可能比人好,人还是会凭借生命力和意义感,找到属于自己的道路的。我站在人类这一边。


张鹏:一甲像一束阳光,照亮了人类的前程。我其实反而希望被 AI 替代,当然是“引号式”的希望。比如,我希望 AI 把我已经熟练掌握的事替代掉,这样我就能有机会去探索新的东西。以前我们可能用一生只完成一件事,因为现实摩擦太大。未来如果 AI 能帮我们减轻负担,我们或许能活出多个“人生版本”。所以我真的希望 AI 跑得再快一点,好让我去尝试更多。


但我觉得最核心的是要捍卫“无知无畏”的力量。很多有意义的事情,正是因为我们不知道它有多难,才敢去做。如果一开始就知道那是坑,就不会跳了。所以很多创新,其实源于无知。AI 的价值或许在于,它让我们更有勇气去无畏,因为有它支持,你的探索代价变小了。人类真正的希望,可能就藏在这种“有底气的无知”里。所以我觉得面对 AI 的未来其实很值得期待。AI 快跑,我们做自己,没问题。今天我们聊了很多,其实就是想把希望带回来。


也感谢潘乱和一甲,以及所有朋友今晚的陪伴。如果你觉得今晚有收获,欢迎关注极客公园的今夜科技谈、甲子光年和潘乱的「乱翻书」。我们不止聊技术产业,也聊人、聊社会、聊生活的更大命题。




(文:甲子光年)

发表评论