浙大+阿里提出快慢思考新方法:在多模态Reasoning上准确率涨10%,长度砍半

MLNLP社区致力于促进国内外机器学习与自然语言处理领域的交流合作。该论文提出FAST框架,旨在解决大型视觉语言模型在回答简单问题时冗长推理的问题。通过动态调节推理深度,FAST提高了准确率并减少了推理长度。

33,000美元奖金池!Meta CRAG-MM挑战赛开启,多模态RAG巅峰对决

Meta CRAG-MM Challenge 2025面向可穿戴设备场景设计,旨在提升视觉问答基准数据集的准确性、上下文理解和实时信息处理能力。通过三个逐层递进的任务全面考察多模态检索增强生成(MM-RAG)系统在现实中的应用。