AxBench:斯坦福NLP团队Python库,评估大型语言模型(LLM)可解释性方法的实用性 上午8时 2025/02/11 作者 NLP工程化 AxBench:斯坦福NLP团队开发的Python库用于评估大型语言模型可解释性方法,提供多种方法支持LLM-in-the-loop训练。