Andrej Karpathy 辣评Veo 3:视频生成将直接优化人类的注意力,TikTok只是弟弟

视频生成,或正成为一个让人细思极恐的转折点。

刚刚,Andrej Karpathy 发文对Google的Veo 3视频生成模型发表了深刻见解,称这不仅仅只是技术进步,更是对整个内容创作生态即将发生巨变的预警。

Karpathy指出,视频生成技术的进步带来了四个关键转变,其中最后一个尤其值得警惕。

一、视频是人脑最高带宽的输入方式

这不仅体现在娱乐内容上,更重要的是在工作和学习场景中——想想那些让复杂概念瞬间清晰的图表、动画和演示。

二、视频是最简单有趣的互动形式

视频是最简单/有趣的,普通人不喜欢阅读/写作,这非常费力。

任何人都可以(并且想要)与视频互动,相比之下,阅读和写作对大多数人来说都是高度耗费精力的活动。

三、创建视频的门槛正在趋近于零

以前制作一个高质量视频需要专业团队、昂贵设备和大量时间,现在只需要一个提示词。

创建视频的障碍是 -> 0

但Karpathy 认为,真正革命性的是第四点:

四、视频第一次成为可以直接优化的对象

Karpathy解释道,传统的视频平台如TikTok,本质上是在一个有限的视频库中进行索引、排序和推荐。

创作者制作内容,算法学习如何将合适的视频推送给合适的用户。

这个「人类创作者学习用户喜好+算法学习推荐策略」的系统,虽然已经让人们对TikTok上瘾,但在Karpathy看来,这只是冰山一角。

Veo 3这类模型输出的视频是神经网络的直接产物,这是一个可微分的过程

这意味着我们可以设定任意目标,然后用梯度下降来优化。无论是用户参与度、瞳孔扩张程度,还是广告点击转化率,都可以成为直接优化的目标。

「为什么要索引有限的视频库,当你可以无限生成并直接优化它们?」

Karpathy问道。

他认为视频将成为AI与人类交流的绝佳界面。

一个精心设计的图表或动画比一堵文字墙更容易让人理解。但当这个高带宽的媒介变得可以直接优化时,我们可能不会喜欢「最优」的样子

chrissy(@chrissyykat)分享了刘慈欣的科幻短篇,暗示我们正在接近那个反乌托邦的未来:

随着Veo 3的发布,我无法停止思考这个。感觉我们每天都在越来越接近

Eric Watson jr(@Ironman_E)认为这将彻底改变视觉创意领域:

我同意。在视觉创意方面,这改变了一切。这是激动人心的时刻。让我们看看现在限制都消失了,我们能有多有创意。希望主要是好的方面。

Shardul(@isharduld)提出了一个关键问题:

当视频参与度变成梯度下降问题时,我们需要什么保障措施?

Emmanuel O(@emmanuelomn)描绘了一个令人不安的场景:

这是个可怕的想法。把人类从等式中移除。我已经能看到了。一个所有视频都由公司生成的社交媒体网站🙃

教育领域的应用前景则更让人期待

Hitarth Sharma(@iamhitarth)设想:

我很好奇这在教育科技领域会如何发展。想象一下为在TikTok上长大的一代人将物理、化学或数学TikTok化,并优化理解而不仅仅是打勾完成任务——那将是了不起的。

Alon Aizescu(@AlonAizescu)发出了更严肃的警告:

在不久的将来,消费在线内容可能比毒品更容易上瘾。所有被AI取代的工人将沉迷于消费内容。谁能在戒毒领域开发出突破性产品将大大受益。

Simon Lermen(@SimonLermenAI)总结到:

噩梦燃料

Vishvanand(@vishvanands1)提出了一个有趣的对比:

为什么同样的事情没有发生在生成文本的LLM上?例如训练LLM编写能产生最大点击/转化的文案

Mr R(@slantsalot)提出了反对意见:

我不完全同意这个观点。例如,恶作剧视频、事故视频、打架视频或尴尬视频只有在真实人类的背景下才有价值。AI视频无法沿着这些奖励向量进行优化以增加价值

Tom Löwe(@awaken_tom)用图片展示了GUI界面现在与5年后的对比,暗示着交互方式的彻底改变。

Jeffrey Emanuel(@doodlestein)的评论引人深思:

基本上我们的孩子注定会成为上瘾的白痴,因为没有其他东西能与这种未来优化的自动垃圾生成竞争。这有点令人沮丧,不是吗?而且很可能是不可避免的。唯一的解决方案是永远不要尝试一次,就像海洛因或可卡因一样。

Nike_Zoldyck(@Nitin_wysiwyg)则幽默总结:

Veo3发布5分钟后……兄弟,世界只是某人写的一个提示词😅

最后,Gabriel Baker(@gabrieljbaker)的观察让人警醒:

这是个大问题。许多青少年显然不喜欢面对面的人际接触。他们活在Character AI和TikTok上。

当视频可以被直接优化来抓住我们的注意力,当AI可以无限生成最「吸引人」的内容,我们是否准备好了面对这个新世界?

对未来的兴奋和憧憬之外,让我有一丝不安的是——

无论这是潘多拉的魔盒,亦或是阿拉丁的神灯,一路向前的我们,似乎已经别无选择。

(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往