谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍
Fast-dLLM 提出分块 KV 缓存和置信度感知并行解码技术,显著提升扩散模型推理速度至原速的 27.6 倍,同时保持较高生成精度。
Fast-dLLM 提出分块 KV 缓存和置信度感知并行解码技术,显著提升扩散模型推理速度至原速的 27.6 倍,同时保持较高生成精度。
英伟达股价因财报飙升至3.394万亿美元,超越苹果成为全球市值第一公司。尽管AI开源模型对英伟达造成短期损失,但其数据中心业务仍保持强势增长,预计2025年第二季度收入将达到280亿美元。
老黄在COMPUTEX 2025演讲中阐述了NVIDIA如何从芯片公司转型为AI基础设施公司的策略,并展示了新款GeForce RTX 5060与Grace Blackwell等旗舰产品。
在数字化转型中,NVIDIA使用Agentic AI技术展示了四大应用场景:AI销售助手简化信息访问和处理;小模型微调提高效率和准确性;智能Slackbot提供高效任务支持;自动化测试生成框架优化软件开发流程。
近期多场AI行业活动推荐,包括湾区闭门深度交流局、AI开发大赛、NVIDIA创业企业展示等。涵盖企业家、AI创业者等多种角色,提供技术指导、资金支持及产业对接。详情请点击阅读原文了解更多。
美国限制英伟达H20芯片对华出口之际,英伟达启动’B计划’在中国设立合资企业。这一调整旨在应对地缘政治紧张局势中的生存之战,但传闻存在不确定性。