新智元
直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型
OpenThinker-32B 是由斯坦福、UC伯克利等机构联合发布的 SOTA 级推理模型,仅需 1/8 数据就与 DeepSeek-R1 达成同等性能。项目使用精心选择的验证数据集,并通过数据规模化、推理过程验证和模型规模扩展的方法实现。
英伟达黑科技登场!RTX神经纹理压缩,显存用量狂减96%
NVIDIA的RTX神经纹理压缩技术通过AI算法大幅优化3D应用中的纹理存储和渲染效率,显存占用降低96%,为游戏和图形设计带来革命性突破。该技术目前处于beta测试阶段,并已在多种显卡上得到验证,未来将广泛应用提升游戏画质和兼容性。
Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败
神Karpathy发现,一个😀竟然占用了多达53个token!这背后隐藏着Unicode编码的哪些秘