首个 vLLM 中文文档上线!最新版本吞吐量再提高 2.7 倍,延迟减少 5 倍,让大语言模型推理更快速! 上午11时 2024/12/03 作者 HyperAI超神经 作者:神经星星 编辑: 李宝珠 由 HyperAI超神经社区志愿者共同翻译校对的 vLLM 中文文档