Dynamo:NVIDIA最新开源的数据中心级分布式推理框架
近日NVIDIA推出开源高性能推理框架Dynamo,专为大规模分布式环境中的生成式AI模型服务设计。它提高了吞吐量30倍以上,并提供了分离预填充、智能路由和动态GPU调度等核心组件来优化性能。
近日NVIDIA推出开源高性能推理框架Dynamo,专为大规模分布式环境中的生成式AI模型服务设计。它提高了吞吐量30倍以上,并提供了分离预填充、智能路由和动态GPU调度等核心组件来优化性能。
Anthropic 从亚马逊筹集了额外40亿美元,将在AWS上训练其生成式AI模型,并与Annapurna Labs合作开发定制芯片。