李飞飞:World Labs这样实现「空间智能」
斯坦福大学教授李飞飞在人工智能顶会NeurIPS上分享了她的研究,她创立的世界实验室致力于生成3D场景并具备空间智能。她认为机器视觉正朝着全面智能迈出关键一步。
斯坦福大学教授李飞飞在人工智能顶会NeurIPS上分享了她的研究,她创立的世界实验室致力于生成3D场景并具备空间智能。她认为机器视觉正朝着全面智能迈出关键一步。
最近AI在生物学领域表现突出。斯坦福大学的研究团队提出了一种基因组基础模型Evo,能在DNA、RNA和蛋白质层面实现零样本预测及高精度生成。它训练于包含数百万个噬菌体和质粒序列的大型数据集上,参数规模达70亿,最大上下文长度可达131,072个token。这一成果已上线HyperAI教程版块供快速体验。
顶尖多模态大模型在AV-Odyssey基准测试中表现不佳,无法正确分辨声音大小。研究团队提出DeafTest和AV-Odyssey评估基准,揭示音频感知仍是大模型的主要瓶颈。
国内智源研究院推出首个利用大规模无标注互联网视频学习的3D生成模型See3D,支持从文本、单视图和稀疏视图到3D的生成。
国内智源研究院推出首个利用大规模无标注互联网视频学习的3D生成模型See3D,支持从文本、单视图和稀疏视图到3D的生成,并进行3D编辑与渲染。
IC-Light 是张吕敏提出的 IC-Light 项目,能够通过文本或背景图片引导改变照片的光影效果。该论文在 ICLR 大会上获得满分评级。作者张吕敏毕业于苏州大学,并在斯坦福读博,发表了多篇 AI 绘画相关论文。
斯坦福大学教授李飞飞发布了她的第一个创业项目World Labs,用户可以通过单张图片或一句话生成3D世界。这是生成式AI进入3D完全沉浸式新时代的一个例子。
斯坦福大学推出IKEA Video Manuals数据集,通过4D对齐视频和说明书来研究AI理解和执行复杂空间任务的能力。该数据集包含6类36种家具的组装视频、说明书及3D模型,并解决了遮挡、相似部件识别等问题。