学术
谷歌“狙击”OpenAI,发布新一代大模型Gemini 2.0!主打Agent+多模态
谷歌推出了新一代大模型Gemini 2.0,专为AI Agent设计。新模型已经在网页端开放使用,并推出名为深度研究的新功能帮助用户进行研究助理工作。Gemini 2.0在多模态、速度和通用助手愿景方面表现出色。
AAAI 2025接收结果出炉!Mamba魔改再次爆发
今年Mamba作为一种新选择性状态空间模型,在CV领域引发关注。其在多项评估中表现出色,并且具有高感知学习能力和低部署效率的优势,能够显著降低计算成本。
李飞飞:World Labs这样实现「空间智能」
斯坦福大学教授李飞飞在人工智能顶会NeurIPS上分享了她的研究,她创立的世界实验室致力于生成3D场景并具备空间智能。她认为机器视觉正朝着全面智能迈出关键一步。
Alphafold3 依赖数据库已打包上线!ICLR 满分论文 IC-Light:准确识别光照色调特征
AlphaFold2 自发布以来就在 AI4S 领域引起轰动,更拿下了今年的诺贝尔奖。AlphaFo
在线教程丨10s 出图!腾讯首个 3D 生成大模型上线
腾讯团队推出Hunyuan3D-1.0,仅需10秒生成高质量3D资产。该框架结合多视角生成与稀疏视角重建技术,在质量和效率上实现了平衡,支持文生3D和图生3D功能。