只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max 下午4时 2025/05/25 作者 机器之心 力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时
纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究 下午4时 2025/05/21 作者 量子位 研究团队提出基于强化学习的视觉规划(VPRL)新范式,实现图像直接驱动推理,显著优于文本规划方法,未来有望推动多模态推理向更直观方向发展。