杭州六小龙最新开源「空间理解模型」,保姆级教程来了!

近日杭州六小龙之一群核科技在GTC 2025大会开源了SpatialLM模型,它是一款大语言模型,能够处理来自多种来源的三维点云数据,并生成结构化的三维场景理解输出。该模型采用了多模态结构,能将非结构化的三维几何数据转化为机器可读格式。

13年后,AlexNet源代码终于公开!带注释的原版

AlexNet 源代码发布,标志着计算机视觉领域的转折点。谷歌与计算机历史博物馆合作发布了 AlexNet 的原始源代码,该模型于 2012 年赢得 ImageNet 大规模视觉识别挑战赛冠军,并对人工智能领域产生了深远影响。