NVIDIA将全量版DeepSeek-R1打包成NIM微服务 2025年2月3日8时 作者 NLP工程化 NVIDIA将DeepSeek-R1打包成NIM微服务,在配备8张H200 GPU的服务器上实现每秒近4000个Token处理速度,支持在本地部署以保障数据安全。