隐藏状态归档

sglang 源码学习笔记（二）- backend & forward 过程

2025年5月19日14时作者 GiantPandaCV

5771025
编辑丨GiantPandaLLM
前言
书接上回，Bruce 仗剑走天涯：sglan

2025年4月30日8时作者 NLP工程化

本文揭示了大型语言模型在预填充阶段的隐藏状态中内在地编码了领域特定知识，并提出了一种利用这些轨迹进行查询路由的模型选择策略，显著提高了性能特别是开放式生成任务的表现。