向视觉版o1出击,阶跃张祥雨团队推出“慢感知”,实现感知层面的推理时scaling
研究团队提出’慢感知’概念,通过分解复杂几何图形为基本形状单元简化处理,并引入’感知流动’机制进行逐步推理。该方法旨在提高视觉模型对复杂几何结构的理解能力,提升多模态大模型在几何解析任务上的表现。
研究团队提出’慢感知’概念,通过分解复杂几何图形为基本形状单元简化处理,并引入’感知流动’机制进行逐步推理。该方法旨在提高视觉模型对复杂几何结构的理解能力,提升多模态大模型在几何解析任务上的表现。
论文提出慢感知概念,通过分解和流动感知几何图形来提高视觉系统2的精细感知能力。研究显示,慢感知能提升模型对几何线段的解析能力,并在多种指标上优于基线方法。
StepFun多模态团队提出慢感知概念,通过感知分解和感知流动两个阶段实现几何图形精细感知。该方法在几何parsing任务上取得显著效果,展示了视觉系统2的优势。