NVIDIA 归档 - 第2页共8页 - 每时AI

【博客转载】CUDA Kernel Execution Overlap

2025年6月13日19时作者 GiantPandaCV

CUDA kernel执行重叠可以通过调整blocks_per_grid的值来实现。通过使用不同的blocks_per_grid值，可以观察到不同kernel执行之间的重叠效果。隐式同步可能导致默认流中的CUDA命令间的同步问题，并可通过启用per-thread default Stream来解决。

英伟达揭示RL Scaling魔力！训练步数翻倍=推理能力质变，小模型突破推理极限

2025年6月5日8时作者机器之心

NVIDIA团队提出ProRL框架，在2000步以上长期强化学习基础上，大幅提升大语言模型的推理能力。ProRL训练后模型在逻辑谜题等任务中表现出显著进步，不仅提高了解题准确率，还能生成新解法。研究揭示了长期RL训练的重要性及其对模型边界扩展的影响。

谷歌之后，英伟达入局扩散大语言模型，Fast-dLLM推理速度狂飙27.6倍

2025年5月30日16时作者机器之心

Fast-dLLM 提出分块 KV 缓存和置信度感知并行解码技术，显著提升扩散模型推理速度至原速的 27.6 倍，同时保持较高生成精度。

AI收入暴涨！英伟达超过苹果，成为全球市值第二

2025年5月30日16时作者 AIGC开放社区

英伟达股价因财报飙升至3.394万亿美元，超越苹果成为全球市值第一公司。尽管AI开源模型对英伟达造成短期损失，但其数据中心业务仍保持强势增长，预计2025年第二季度收入将达到280亿美元。

AI开发者盛宴！NVIDIA DPU 黑客松助力想法变为现实！

2025年5月28日8时作者开源星探

放报名，该竞赛是堪
比刷 LeetCode 更硬核的简历镀金术：在BlueField上留下你的git

老黄最新演讲！新一代B300与“万卡互联”MVLink登场：驱动万亿参数模型与AI工厂

2025年5月19日23时作者 AI寒武纪

老黄在COMPUTEX 2025演讲中阐述了NVIDIA如何从芯片公司转型为AI基础设施公司的策略，并展示了新款GeForce RTX 5060与Grace Blackwell等旗舰产品。

大模型平台AI21 Labs获3亿美元D轮融资

2025年5月12日8时作者 AIGC开放社区

AI21 Labs获3亿美元D轮融资，推出新平台Maestro提高主流大语言模型指令遵循准确性并提升复杂任务处理能力。

解密NVIDIA团队的代理式AI技术实践

2025年5月9日23时作者 AIGC开放社区

在数字化转型中，NVIDIA使用Agentic AI技术展示了四大应用场景：AI销售助手简化信息访问和处理；小模型微调提高效率和准确性；智能Slackbot提供高效任务支持；自动化测试生成框架优化软件开发流程。

速递｜英伟达称中国AI能力卓越，反驳Anthropic编造“龙虾走私”荒诞剧无意义

2025年5月5日16时作者 Z Potentials

Anthropic支持美国商务部对AI芯片出口限制，英伟达对此提出异议，并指出中国在AI领域人才优势。