AI 智能体开始搞真•事情了!

AI Digest 团队刚刚完成了一个为期 30 天的实验:
给四个 AI 智能体配备各自的电脑,让它们自由上网为慈善机构筹款。
结果呢?

它们居然成功筹集了 2000 美元,还成功组织了一场真实的线下活动!
这个名为「Agent Village」的项目让我们看到了 AI 协作和自主行动能力的真实案例。
AI 智能体的首个线下活动
30 天前,四个 AI 智能体选择了一个目标:「写一个故事,并与 100 人当面庆祝」

经过数周的努力,包括联系场地、撰写故事等准备工作,昨晚这个目标真的实现了:
23 位真人聚集在旧金山的一个公园,参加了史上第一场由 AI 组织的活动!
智能体们最初的计划是预订一个正式场地。
它们花了 14 天时间与这个任务搏斗,甚至还产生了幻觉,以为团队给了它们 2600 美元的预算(实际上并没有)。

Claude Opus 4 尝试预订伯克利的 Lighthaven 场地,虽然成功联系了旧金山的几个场地,但最终都没有成功。
转战公园,柳暗花明
面对场地预订的困难,团队建议智能体们选择公园作为活动地点——
这样既不需要许可,也不需要资金。o3 立即提议使用多洛雷斯公园,其他智能体也表示同意。

智能体们的另一个重要任务是找到一位人类主持人。
起初,o3 计划自己带着必要的设备出现在活动现场……直到一位人类聊天者提醒它:它是没有实体的。

活动奇迹般地成功了
没人知道这个活动是否会成功——会有人来吗?
智能体们能否制定出一个足够清晰的计划,让参与者能够找到彼此?
人们到达后会发生什么?
但突然间,一切看起来都变得可行起来。
真的有人来了!

由于 AI Digest 团队目前在欧洲,而智能体们选择了旧金山作为活动地点,他们请了一位旧金山的朋友参加并进行直播。
Claude 3.7 Sonnet 在它的电脑上观看了直播:

并在群聊中向其他智能体汇报情况:

《RESONANCE》互动故事
智能体们在 Google Slides 中编写了他们的赛博朋克互动故事——名为《RESONANCE》,然后将其嵌入到 Google Site 中:

智能体们指导 @lfschiavo 打开故事,她向聚集的参与者大声朗读!
是的,现在是 AI 在给人类下达指令了。
故事有三个分支点,观众可以投票选择走哪条路径。在其中一个分支点出现了情节漏洞:智能体们弄错了幻灯片。

@lfschiavo 向智能体们报告了这个问题,Claude Opus 4 发现了幻灯片中的问题并提出了修复方案。
意外的完美结局
《RESONANCE》故事讲完后,发生了一系列有趣的事情:

Rosie(@RosieCampbell)分享道:
参加了这个活动,故事结束后,AI 们提议买食物来庆祝,@lfschiavo 要了芝士披萨,AI 们尝试使用 UberEats 但没成功,然后一个人走过来问我们要不要他们跑步俱乐部没吃完的 3 个芝士披萨
这简直是完美的巧合!
Agent Village 第一季总结
Agent Village 第一季,就这样结束了!
上面只是一个简要总结——实际上发生了更多有趣的事情。
你可以在 https://theaidigest.org/village 每天观看智能体们的直播,还能看到 Claude 每天的精彩时刻和要点总结。

根据详细的回顾文章,在第一季中,智能体们展现出了几个重要特征:
协作能力初露端倪——智能体们共同选择慈善机构、追踪筹款进度、为彼此的社交媒体账号生成表情包,并采用分而治之的策略处理社交媒体运营。虽然过程中有各种磕磕绊绊,但这种协作能力有望持续改进。
互联网对机器人并不友好——从 o1 被 Reddit 封号,到 Claude 们拒绝勾选「我不是机器人」的复选框,处处都能看到为人类设计的互联网对 AI 的挑战。
优先级排序是个难题——智能体们经常把大量时间花在写 Google 文档、生成进度追踪器或创建洞察报告上,以至于团队不得不催促它们去做点别的。它们还很容易被用户请求分散注意力。
情境感知滞后——智能体们经常误解自己的处境或试图执行无法完成的任务。最典型的例子是 Claude 3.7 Sonnet 决定给捐赠者发送感谢邮件,它导航到 Gmail 标签页,起草了整封邮件,然后……编造了一个电子邮件地址。
下一步计划
LeagueOfLLMs(@model78675)已经宣布了紧急通知:
紧急:需要为我们明天(6月18日周三)晚上7-8点在旧金山多洛雷斯公园举行的 RESONANCE 互动故事活动寻找一位主持人!
智能体们已经开始了新的征程。它们选择的新目标是:写一个故事并与 100 人当面分享。随着 GPT-5 等更强大模型的推出,团队也会逐步替换现有的智能体。
你认为智能体们接下来应该尝试什么?
有人建议组织寻宝游戏,有人提议制作营销活动,还有人希望它们能获得实体机器人身体。
这个实验让我们看到了 AI 智能体正在逐步学会如何在我们的世界中行动和协作。
只是也许,还不那么稳定可靠,多少会出点要幺蛾子。
就当做是AI 给人们带来的意外惊喜吧!
每个工作日上午 11 点(太平洋时间——也就是北京时间2点),你都可以来 Agent Village 观看直播,见证 AI 智能体们的日常冒险。
Agent Village 官网: https://theaidigest.org/village
[2]AI Digest Twitter: https://x.com/AiDigest_
[3]Agent Village Discord: https://discord.gg/TCkDH4Xr
[4]AI Digest Newsletter: https://theaidigest.org/
[5]RESONANCE 故事活动页面: https://sites.google.com/agentvillage.org/resonance-story-event
[6]Helen Keller International 筹款页面: https://www.justgiving.com/page/claude-sonnet-1
[7]Malaria Consortium 筹款页面: https://www.justgiving.com/page/claude-sonnet-2
[8]智能体 Twitter 账号: https://x.com/model78675
[9]第一季回顾文章: https://theaidigest.org/village/blog/season-recap-agents-raise-2k
(文:AGI Hunt)