探索LLM如何捕捉和表征领域特定知识 上午8时 2025/04/30 作者 NLP工程化 本文揭示了大型语言模型在预填充阶段的隐藏状态中内在地编码了领域特定知识,并提出了一种利用这些轨迹进行查询路由的模型选择策略,显著提高了性能特别是开放式生成任务的表现。
三思而后行,让大模型推理更强的秘密是「THINK TWICE」? 下午4时 2025/04/05 作者 机器之心 近期研究提出的新方法三思而后行(Think Twice)通过多轮推理显著提升了大语言模型的性能,无需新的训练,仅需简单的提示工程。