「倒计时3天」2025 WAIC云帆奖全球征集|共青年之智,铸AGI未来

2025 WAIC 云帆奖全球征集倒计时3天。奖项面向AI青年先锋,提供学术、科研资助及产业生态支持。通过初审和终审后公布获奖名单并颁奖。璀璨明星和明日之星各有10名和15名名额。

【博客转载】CUDA Kernel Execution Overlap

CUDA kernel执行重叠可以通过调整blocks_per_grid的值来实现。通过使用不同的blocks_per_grid值,可以观察到不同kernel执行之间的重叠效果。隐式同步可能导致默认流中的CUDA命令间的同步问题,并可通过启用per-thread default Stream来解决。

在线教程丨刷新TTS模型SOTA,OpenAudio S1基于200万小时音频数据训练,深刻理解情感及语音细节

HyperAI超神经官网推出OpenAudio-s1-mini教程,介绍高效文本转语音生成工具。OpenAudio S1包含OpenAudio-S1和OpenAudio-S1-mini版本,在大规模音频数据上训练,参数扩展至40亿,并引入奖励建模及RLHF训练机制,显著提升音频质量、情感表达和说话人相似度。该模型仅需每百万字节15美元(约0.8美元/小时),支持多种情感、语调和特殊标记。HyperAI超神经提供免费RTX 4090资源体验OpenAudio-s1-mini功能。

CVPR 2025 Highlight|北大联手智元发布首个基于说明书的家电操作评测基准

北京大学联合智元机器人团队提出CheckManual评测框架,专注于研究基于说明书的家电操作。该框架包含1107份不同内容的家电说明书,涵盖2211个可操作部位和1464个操作任务。通过OCR、多模态大模型解析说明文字及视觉信息,提出ManualPlan模型进行详细的操作规划,并实现与家用电器的真实交互。

1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

Nano-vLLM 是一个由 DeepSeek AI 研究者俞星凯构建的轻量级 vLLM 实现,代码简化至 1200 行。其亮点包括快速离线推理、简洁易读的代码库以及优化套件等功能。与 vLLM 相比,Nano-vLLM 在输出 token 和时间上表现相近,但略逊于 vLLM 的吞吐量。