4000 Token/秒归档

NVIDIA将全量版DeepSeek-R1打包成NIM微服务

2025年2月3日8时作者 NLP工程化

NVIDIA将DeepSeek-R1打包成NIM微服务，在配备8张H200 GPU的服务器上实现每秒近4000个Token处理速度，支持在本地部署以保障数据安全。