Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败 下午12时 2025/02/13 作者 新智元 神Karpathy发现,一个😀竟然占用了多达53个token!这背后隐藏着Unicode编码的哪些秘
CUDA-MODE课程笔记 第17课 GPU集合通信(NCCL) 下午2时 2024/12/31 作者 GiantPandaCV 我的课程笔记,欢迎关注:https://github.com/BBuf/how-to-optim-a