VPRL 归档 - 每时AI

只用图像也能思考，强化学习造就推理模型新范式！复杂场景规划能力Max

2025年5月25日16时作者机器之心

力不断提升。然而，现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介，即便是在处理视觉信息时

纯靠“脑补”图像，大模型推理准确率狂飙80%丨剑桥谷歌新研究

2025年5月21日16时作者量子位

研究团队提出基于强化学习的视觉规划（VPRL）新范式，实现图像直接驱动推理，显著优于文本规划方法，未来有望推动多模态推理向更直观方向发展。