OpenAI正式发布Operator,一款能操作浏览器的AI,打响2025智能体大战第一枪!
木易介绍了自己的公众号’AI信息Gap’,专注于分享AI知识,并提到OpenAI发布的Operator Agent标志着AI发展进入第三阶段——智能体。Operator具备自主性和决策能力,可以理解模糊意图、规划任务并执行操作。木易认为Operator是真正的助手而非工具,展示了其在浏览器中执行预定餐厅、购物等任务的能力。同时指出Operator目前仍处于研究预览阶段,并且存在局限性。
木易介绍了自己的公众号’AI信息Gap’,专注于分享AI知识,并提到OpenAI发布的Operator Agent标志着AI发展进入第三阶段——智能体。Operator具备自主性和决策能力,可以理解模糊意图、规划任务并执行操作。木易认为Operator是真正的助手而非工具,展示了其在浏览器中执行预定餐厅、购物等任务的能力。同时指出Operator目前仍处于研究预览阶段,并且存在局限性。
谷歌正对OpenAI竞争对手Anthropic进行超过10亿美元投资,以增强其地位。Anthropic是生成性AI初创企业之一,致力于开发能够根据用户提示生成文本、图像和代码的工具。
OpenAI 推出名为Operator的研究预览版代理,能够像人类一样浏览网页并执行各种在线任务。这款工具结合了GPT-4o的视觉能力和强化学习,支持WebArena和WebVoyager基准测试领先水平。它具备自我纠错能力,并且允许用户个性化工作流程。OpenAI计划将其公开于API中并扩大访问权限。
字节联合清华发布的UI-TARS AI Agent纯视觉感知、端到端架构及系统2推理能力使其成为通用GUI自动化新突破。多项硬核数据验证其性能超越Claude和GPT-4等现有模型。
OpenAI 正研发一款 AI 编码助手,目标是复制谷歌 Level 6 工程师能力。该助手能处理复杂软件工程任务,2025 年底前计划用户从3亿增长至10亿日活,并力争营收1000亿美元。
木易是专注于AI领域的公众号作者,分享AI全维度知识。近期发现DeepSeek-R1结合深度思考和联网搜索功能后效果显著,远超国内另一大模型阿里通义千问。
木易是互联网技术产品经理,专注于分享AI知识和工具。近期谷歌发布的新模型Gemini-2.0-Flash-Thinking-Exp-01-21,具有100万tokens上下文窗口、原生代码执行等功能,助力提升推理能力和输出长度。这是AI领域内的一个重要进展。
生成性人工智能推动2024年消费者在应用程序上的支出达1500亿美元,AI应用支出同比增长超200%,预计一年内将进入前十大消费类别。