NVIDIA
Dynamo:NVIDIA最新开源的数据中心级分布式推理框架
近日NVIDIA推出开源高性能推理框架Dynamo,专为大规模分布式环境中的生成式AI模型服务设计。它提高了吞吐量30倍以上,并提供了分离预填充、智能路由和动态GPU调度等核心组件来优化性能。
速递|英伟达天价收购80人团队Gretel,利用合成数据补全AI基础设施
Nvidia宣布收购生成合成AI训练数据平台Gretel,预计九位数交易金额,其技术将用于 Nvidia 的生成式 AI 服务套件。
AI Agents+推理,英伟达开源Llama Nemotron系列模型与工具
NVIDIA在GTC 2025上发布了基于Llama模型的Nemotron推理系列AI模型,支持128K个标记上下文长度,并推出了新的Agentic AI构建模块加速协作AI系统的开发和应用。
黄仁勋年度演讲来了,Scaling Law失效只是假象,推理需求暴涨100倍,AI模型优化迎来新挑战|GTC 2025
IDIA GTC 2025 的主会开场演讲来了!
在黄仁勋的这场演讲前,英伟达股票还是
119.53