vLLM 归档 - 每时AI

大模型RL训练框架的进化之路

2025年7月21日23时作者极市干货

om/p/1930280222068053288
编辑丨极市平台
极市导读
本文
系统梳理了大模型强

2025年7月21日14时作者小兵的AI视界

境开箱即用的语音理解功能，具有极高的性价比
。
它包含两个版本，分别是用于生产规模应用的
24B
参

2025年7月4日14时作者 GiantPandaCV

文章介绍了如何使用vllm进行最小程度的异步二次开发，重点讲解了AsyncLLM的工作原理和如何通过生成异步协程来提高单条请求处理效率。

2025年6月30日11时作者路过银河AI

Hunyuan-A13B
，这是一个基于细粒度混合专家（MoE）架构的创新且开源的大语言模型（LL

2025年6月17日11时作者 AI寒武纪

表现良好的 MindIE 推理引擎
，并原生支持 Atlas 800 A2 系列和 Atlas 30

2025年6月13日16时作者量子位

仅用不到1200行代码实现Nano-vLLM，该项目由DeepSeek研究员俞星凯创作。Nano-vLLM有三大特点：快速离线推理、可读性强的代码库以及优化套件。通过比较vLLM与Nano-vLLM在不同硬件和模型配置下的基准测试结果，Nano-vLLM表现出色。

2025年6月11日14时作者 GiantPandaCV

online serving 这两种场景下的整体运作流程，以offline batching为例：

2025年5月29日16时作者机器之心

Claude
三大开发者大会接连登场的一周里，微软为
Windows
加装模型上下文协议（
MCP