llm-d:Kubernetes原生高性能分布式LLM推理框架,助力大规模语言模型推理部署 上午8时 2025/05/22 作者 NLP工程化 Kubernetes原生高性能分布式LLM推理框架,提升性能、灵活部署和优化资源利用。相关技术参考及服务内容介绍。