跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

视觉规划

只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max

下午4时 2025/05/25 作者 机器之心

力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时

分类 学术、 资讯 标签 EM、 Gemini 2.5 Pro、 PR、 VPFT、 VPRL、 视觉规划 发表评论

纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究

下午4时 2025/05/21 作者 量子位

研究团队提出基于强化学习的视觉规划(VPRL)新范式,实现图像直接驱动推理,显著优于文本规划方法,未来有望推动多模态推理向更直观方向发展。

分类 资讯 标签 80%、 VPRL、 伦敦大学学院、 剑桥、 视觉规划、 谷歌 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • 造梦师手记:难以描述的像素风!
  • 登Nature子刊!华中科技大学提出融合策略AI模型,实现多中心、跨专科感染性休克死亡风险的精准预测
  • 2.3k星!一款基于Tauri、Vite 6、Vue 3 和 TypeScript 构建的即时通讯系统HuLa
  • 两款开源编程AI助手工具,又一款本地化Manus AI的替代方案
  • 苹果、谷歌、Meta、OpenAI都在抢的新赛道,中国公司的机会在哪?

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×