OpenAI正式发布Operator,一款能操作浏览器的AI,打响2025智能体大战第一枪!

木易介绍了自己的公众号’AI信息Gap’,专注于分享AI知识,并提到OpenAI发布的Operator Agent标志着AI发展进入第三阶段——智能体。Operator具备自主性和决策能力,可以理解模糊意图、规划任务并执行操作。木易认为Operator是真正的助手而非工具,展示了其在浏览器中执行预定餐厅、购物等任务的能力。同时指出Operator目前仍处于研究预览阶段,并且存在局限性。

突发!OpenAI 刚刚发布代理Operator:AI进入Level 3,但只有美国Pro用户可以试用

OpenAI 推出名为Operator的研究预览版代理,能够像人类一样浏览网页并执行各种在线任务。这款工具结合了GPT-4o的视觉能力和强化学习,支持WebArena和WebVoyager基准测试领先水平。它具备自我纠错能力,并且允许用户个性化工作流程。OpenAI计划将其公开于API中并扩大访问权限。

谷歌新推理模型重磅来袭:百万上下文,代码执行,推理能力飙升!

木易是互联网技术产品经理,专注于分享AI知识和工具。近期谷歌发布的新模型Gemini-2.0-Flash-Thinking-Exp-01-21,具有100万tokens上下文窗口、原生代码执行等功能,助力提升推理能力和输出长度。这是AI领域内的一个重要进展。