学术归档 - 第255页共283页

多智能体架构Insight-V来了！突破长链视觉推理瓶颈

2024年12月13日14时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

2024年12月13日14时作者 PaperWeekly

©PaperWeekly 原创 · 作者 |
于星橦
单位 |
新加坡管理大学博士后
个人主页 |

2024年12月13日14时作者机器之心

机器之心原创
作者：Panda
OpenAI 是懂营销的，连续 12 天发布，每天一个新花样，如今刚

2024年12月13日14时作者 PaperWeekly

谷歌推出了新一代大模型Gemini 2.0，专为AI Agent设计。新模型已经在网页端开放使用，并推出名为深度研究的新功能帮助用户进行研究助理工作。Gemini 2.0在多模态、速度和通用助手愿景方面表现出色。

2024年12月13日14时作者 PaperWeekly

今年Mamba作为一种新选择性状态空间模型，在CV领域引发关注。其在多项评估中表现出色，并且具有高感知学习能力和低部署效率的优势，能够显著降低计算成本。

2024年12月13日14时作者机器之心

斯坦福大学教授李飞飞在人工智能顶会NeurIPS上分享了她的研究，她创立的世界实验室致力于生成3D场景并具备空间智能。她认为机器视觉正朝着全面智能迈出关键一步。

2024年12月13日14时作者机器之心

机器之心报道
机器之心编辑部
扩散模型和流匹配实际上是同一个概念的两种不同表达方式吗？
从表面上看，

2024年12月13日12时作者 HyperAI超神经

AlphaFold2 自发布以来就在 AI4S 领域引起轰动，更拿下了今年的诺贝尔奖。AlphaFo

2024年12月13日12时作者 HyperAI超神经

腾讯团队推出Hunyuan3D-1.0，仅需10秒生成高质量3D资产。该框架结合多视角生成与稀疏视角重建技术，在质量和效率上实现了平衡，支持文生3D和图生3D功能。

2024年12月13日8时作者 PaperWeekly

论文题目：
STIV: Scalable Text and Image Conditioned Vi