刚刚,谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础
ViT三大核心作者翟晓华、卢卡斯·拜尔和亚历山大·科列斯尼科夫集体离职谷歌DeepMind,加入OpenAI。他们在计算机视觉领域的研究包括ViT及其衍生工作、SigLIP、PaliGamma等。
ViT三大核心作者翟晓华、卢卡斯·拜尔和亚历山大·科列斯尼科夫集体离职谷歌DeepMind,加入OpenAI。他们在计算机视觉领域的研究包括ViT及其衍生工作、SigLIP、PaliGamma等。
2014年来自Karpathy与Dzmitry Bahdanau的实习生提出的简化注意力机制在机器翻译项目中诞生,后来被应用于Transformer模型。
阿里通义实验室推出OmniSearch多模态检索智能体,通过动态规划提高检索效率和生成内容准确性。OmniSearch能根据问题情境动态调整检索策略,显著优于传统方法,尤其在需要多步推理、多模态知识和快速变化答案的问题上表现优异。
组委会 发自 凹非寺
量子位 | 公众号 QbitAI
还有一周!
一年一度的科技顶流盛会——
ME
NeurIPS 2024最佳论文出炉,3篇华人一作。其中,《Visual Autoregressive Modeling》提出了一种新的图像生成框架,能显著超越现有的自回归模型和扩散模型;《Stochastic Taylor Derivative Estimator》展示了高效算法优化神经网络损失函数,并提供了内存减少和速度提升;《Not All Tokens Are What You Need for Pretraining》引入了选择性语言建模方法提升了预训练性能;《Guiding a Diffusion Model with a Bad Version of Itself》提出自引导方法提高图像生成质量。