开源AI Agent 的最强重磅炸弹来了!

Intelligent Internet(II)团队刚刚发布了可能是世界上最强大的通用AI Agent,而且还完全开源了!

这或者不是普通的开源,而是真正的开源巨炮。
II-Agent在Meta的GAIA基准测试中取得了75.57%的惊人成绩,远远超过了所有公开可用的模型,向人类水平(92%)又迈进了一大步。
这下可把那些闭源的Manus和GenSpark AI 给整急了!
打榜GAIA
GAIA是Meta发布的一个全新基准测试,专门评估AI助手在处理现实场景中的多种能力,包括多模态处理、工具使用和网络搜索等。
这个基准测试非常有挑战性。
根据Meta的论文,普通人类在这项测试中能达到92%的准确率,而配备了插件的GPT-4仅能达到15%。
这种巨大的差距表明,尽管现在的AI模型在法律、化学等专业领域已经超越人类,但在一些对人类来说简单的任务上,AI仍有很长的路要走。
而II-Agent的75.57%成绩,一下子拉近了这个差距!
II-Agent:强大且可扩展的开源框架
那么,这个II-Agent到底是个什么神器?
II-Agent是一个完全开源的智能助手框架,被设计用来提高各个领域的工作流程效率。它不仅开箱即用,而且还可以轻松地适应和扩展。
II团队的使命是「增加人类的智能」,他们认为:
2025年是Agent的元年。对于真正重要的事物,它们的agent必须是开放、透明和可用的。

看起来II团队不仅仅满足于发布一个单一的agent,他们正在构建一个更广泛的系统,因为他们相信未来将是「agent群体为我们所有人工作」的时代。
与Manus和GenSpark AI的对比
如果你还不了解这个领域,那么你需要知道:
Manus 是由中国初创公司Monica(蝴蝶效应AI)在2025年3月推出的先进自主AI agent。它能够处理复杂任务,整合多种工具,在GAIA基准测试中得分约65%。
GenSpark AI 则是一个创新型AI agent引擎,由前百度高管创立。它重新构想了传统搜索方式,使用多agent框架为用户查询生成定制的实时「Sparkpages」。
虽然这两个都是业界领先的产品,但它们都是闭源的。
而II-Agent的出现,带来了一个完全开源且性能超越它们的选择!
II-Agent的核心能力
II-Agent能力全面,简直就是样样精通:
-
研究与事实核查:多步骤网络搜索,来源三角验证,结构化笔记,快速总结
-
内容生成:博客与文章草稿,课程计划,创意散文,技术手册,网站创建
-
数据分析与可视化:清洗,统计,趋势检测,制图,自动报告生成
-
软件开发:跨多种语言的代码合成,重构,调试,测试编写和分步教程
-
工作流自动化:脚本生成,浏览器自动化,文件管理,流程优化
-
问题解决:分解,替代路径探索,分步指导,故障排除
K(@K_to_Macro) 问道:「等等,这是MIT许可证?」
答案是:

技术细节:它是如何工作的?
II-Agent系统围绕Anthropic的Claude模型构建,提供:
-
CLI接口,直接在命令行交互
-
基于WebSocket的服务器,为现代React前端提供支持
-
与Google Cloud的Vertex AI集成,用于API访问Anthropic模型

核心方法包括:
-
核心Agent架构与LLM交互
-
动态系统提示 -
全面的交互历史管理 -
智能上下文管理 -
规划与反思
-
结构化推理 -
问题分解与顺序思考 -
假设形成与测试 -
执行能力
-
文件系统操作 -
命令行执行 -
网络交互与浏览器自动化
这些技术细节让II-Agent能够像人类一样思考和工作,而不仅仅是简单地响应指令。
社区反应
II-Agent的发布在社区中引起了热烈反响:
ZehraQM(@ZehraDidntSay) 表达了她的喜悦:「🥳 太棒了!」
Toby(@Cryptotobias_) 赞叹道:「超级令人兴奋!干得好 @EMostaque」
AllAboutAI(@AllAboutAicom) 指出:「GAIA上的75.57%很令人印象深刻」
BADAKS(@BigwinLuckyG) 评论:「出色的工作,传奇」
然而,也有人提出了问题。
David Fergus(@DavidFe20490699) 指出:「只有一个问题 – 没有创建按钮,只有一个博客!??」
立即上手II-Agent
如果想尝试这个强大的工具,可以前往相关链接:
-
GitHub:https://github.com/Intelligent-Internet/ii-agent
-
GAIA示例重放页面:https://ii-agent-gaia.ii.inc/
-
GAIA-Trace:https://huggingface.co/datasets/Intelligent-Internet/ii-agent_gaia-benchmark_validation
Agent 的II-Agent的发布并开源,或许标志着——
我们正式进入了真正的AI Agent时代!
(文:AGI Hunt)