世界最强通用智能体 II-Agent发布!碾压Manus 和Genspark

开源AI Agent 的最强重磅炸弹来了!

Intelligent Internet(II)团队刚刚发布了可能是世界上最强大的通用AI Agent,而且还完全开源了!

这或者不是普通的开源,而是真正的开源巨炮

II-Agent在Meta的GAIA基准测试中取得了75.57%的惊人成绩,远远超过了所有公开可用的模型,向人类水平(92%)又迈进了一大步。

这下可把那些闭源的Manus和GenSpark AI 给整急了!

打榜GAIA

GAIA是Meta发布的一个全新基准测试,专门评估AI助手在处理现实场景中的多种能力,包括多模态处理工具使用网络搜索等。

这个基准测试非常有挑战性。

根据Meta的论文,普通人类在这项测试中能达到92%的准确率,而配备了插件的GPT-4仅能达到15%。

这种巨大的差距表明,尽管现在的AI模型在法律、化学等专业领域已经超越人类,但在一些对人类来说简单的任务上,AI仍有很长的路要走。

而II-Agent的75.57%成绩,一下子拉近了这个差距

II-Agent:强大且可扩展的开源框架

那么,这个II-Agent到底是个什么神器?

II-Agent是一个完全开源的智能助手框架,被设计用来提高各个领域的工作流程效率。它不仅开箱即用,而且还可以轻松地适应和扩展。

II团队的使命是「增加人类的智能」,他们认为:

2025年是Agent的元年。对于真正重要的事物,它们的agent必须是开放、透明和可用的。

看起来II团队不仅仅满足于发布一个单一的agent,他们正在构建一个更广泛的系统,因为他们相信未来将是「agent群体为我们所有人工作」的时代。

与Manus和GenSpark AI的对比

如果你还不了解这个领域,那么你需要知道:

Manus 是由中国初创公司Monica(蝴蝶效应AI)在2025年3月推出的先进自主AI agent。它能够处理复杂任务,整合多种工具,在GAIA基准测试中得分约65%。

GenSpark AI 则是一个创新型AI agent引擎,由前百度高管创立。它重新构想了传统搜索方式,使用多agent框架为用户查询生成定制的实时「Sparkpages」。

虽然这两个都是业界领先的产品,但它们都是闭源的。

而II-Agent的出现,带来了一个完全开源且性能超越它们的选择!

II-Agent的核心能力

II-Agent能力全面,简直就是样样精通

  • 研究与事实核查:多步骤网络搜索,来源三角验证,结构化笔记,快速总结

  • 内容生成:博客与文章草稿,课程计划,创意散文,技术手册,网站创建

  • 数据分析与可视化:清洗,统计,趋势检测,制图,自动报告生成

  • 软件开发:跨多种语言的代码合成,重构,调试,测试编写和分步教程

  • 工作流自动化:脚本生成,浏览器自动化,文件管理,流程优化

  • 问题解决:分解,替代路径探索,分步指导,故障排除

K(@K_to_Macro) 问道:「等等,这是MIT许可证?」

答案是:

技术细节:它是如何工作的?

II-Agent系统围绕Anthropic的Claude模型构建,提供:

  • CLI接口,直接在命令行交互

  • 基于WebSocket的服务器,为现代React前端提供支持

  • 与Google Cloud的Vertex AI集成,用于API访问Anthropic模型

核心方法包括:

  1. 核心Agent架构与LLM交互

    • 动态系统提示
    • 全面的交互历史管理
    • 智能上下文管理
  2. 规划与反思

    • 结构化推理
    • 问题分解与顺序思考
    • 假设形成与测试
  3. 执行能力

    • 文件系统操作
    • 命令行执行
    • 网络交互与浏览器自动化

这些技术细节让II-Agent能够像人类一样思考和工作,而不仅仅是简单地响应指令。

社区反应

II-Agent的发布在社区中引起了热烈反响:

ZehraQM(@ZehraDidntSay) 表达了她的喜悦:「🥳 太棒了!」

Toby(@Cryptotobias_) 赞叹道:「超级令人兴奋!干得好 @EMostaque」

AllAboutAI(@AllAboutAicom) 指出:「GAIA上的75.57%很令人印象深刻」

BADAKS(@BigwinLuckyG) 评论:「出色的工作,传奇」

然而,也有人提出了问题。

David Fergus(@DavidFe20490699) 指出:「只有一个问题 – 没有创建按钮,只有一个博客!??」

立即上手II-Agent

如果想尝试这个强大的工具,可以前往相关链接:

  • GitHub:https://github.com/Intelligent-Internet/ii-agent

  • GAIA示例重放页面:https://ii-agent-gaia.ii.inc/

  • GAIA-Trace:https://huggingface.co/datasets/Intelligent-Internet/ii-agent_gaia-benchmark_validation


Agent 的II-Agent的发布并开源,或许标志着——

我们正式进入了真正的AI Agent时代!

(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往