浙大+阿里提出快慢思考新方法:在多模态Reasoning上准确率涨10%,长度砍半

MLNLP社区致力于促进国内外机器学习与自然语言处理领域的交流合作。该论文提出FAST框架,旨在解决大型视觉语言模型在回答简单问题时冗长推理的问题。通过动态调节推理深度,FAST提高了准确率并减少了推理长度。