领域微调归档

探索LLM如何捕捉和表征领域特定知识

2025年4月30日8时作者 NLP工程化

本文揭示了大型语言模型在预填充阶段的隐藏状态中内在地编码了领域特定知识，并提出了一种利用这些轨迹进行查询路由的模型选择策略，显著提高了性能特别是开放式生成任务的表现。