NeurIPS 2024 让大语言模型使用代码解决图分析推理任务

本文提出了一种通过编程来提升大模型解决图分析推理任务能力的方法,并展示了在开源和闭源模型上进行实验的结果,使用新的基准数据集ProGraph验证了这一方法的有效性。

Ilya 「Scaling What」的答案会是程序性知识吗?

UCL和Cohere的研究发现,LLM从预训练数据中学到了一种通用的推理方法,这种方法依赖于程序性知识。程序性知识涉及执行特定任务或解决问题所需的步骤和方法。该工作表明,对于推理问题,模型通过综合多种文档中的程序性知识来生成答案,而非简单地检索已知事实。