新突破!微软开源多模态AI Agent,通杀数字、物理世界

微软开源多模态AI Agent基础模型Magma,具备跨数字、物理世界的多模态能力。Magma可自动处理图像、视频等数据,并内置心理预测功能。MAGMA架构使用视觉与大语言模型的混合技术实现多模态能力,展示了其在不同场景中的应用。

谷歌提出Titans:突破算力限制,扩展上下文

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言等大语言模型发展和应用落地。谷歌发布新研究Titans,通过神经长期记忆模块扩展大模型上下文窗口至200万token,超越现有Transformer模型。