谷歌“世界模拟器”深夜上线!一句话生成3D世界,支持分钟级超长记忆

谷歌DeepMind发布新一代通用世界模型Genie 3,支持720P画质、每秒24帧实时导航和分钟级一致性保持。Tejas Kulkarni体验后评价其通用性强且能学习物理特性。Genie 3现已以研究预览形式发布,并展示在雅典风格建筑中漫步的场景画面中物体能够保持一致。

1句话生成可玩的3D世界!谷歌Genie3震圈登场,世界模型终于迎来ChatGPT时刻

谷歌DeepMind发布的Genie 3是首个支持实时交互的通用世界模型,能生成逼真、一致的720p分辨率3D环境,支持天气变化和新角色操作,并用于测试未来Agent训练兼容性。但目前仍存在行动空间有限、与其他Agent交互复杂、无法精确模拟真实位置等局限性。

御三家打起来了:OpenAI 开源、谷歌发布可交互的世界模型、Claude 4.1 成了编程新旗舰

硅谷三巨头同日发布新模型,OpenAI开源两款参数量接近o4-mini的GPT-oss模型;DeepMind推出Genie3世界模型实现实时交互和高一致性场景;Anthropic发布Claude Opus 4.1,提升智能体任务及编程能力。

谷歌DeepMind深夜放核弹:世界模型Genie 3登场,重新定义“生成式AI”

谷歌DeepMind发布第三代通用世界模型Genie 3,可以生成实时交互式环境,实现实时导航、一致性和高分辨率。其突破包括实时性能、长时程一致性以及可提示的世界事件能力。

实现 Agent 能力的泛化 ,是否一定需要对世界表征?

本周会员通讯涉及实现Agent能力泛化的必要性、AI助理离 Jarvis 还有多远及OpenAI前产品VP的心法等内容。主要讨论了是否需要对世界进行表征的问题,不同范式的效果和局限性,以及AI助理的前景和技术细节等议题。