Google DeepMind
4K 视频生成!Google 版 Sora 深夜秀肌肉,再度狙击 OpenAI
Google Deepmind 推出的新视频模型 Veo 2 和 Imagen 3 提供了更高分辨率的视频生成能力,并改进了指令识别和物理现象模拟功能。Veo 2 还引入了不可见的 SynthID 水印以确保其 AI 生成属性,而 Imagen 3 在多个国家推出的同时支持多种艺术风格的图像创作。
视频一键拆分PS层!DeepMind新模型效果碾压同级,物体、背景完美分离,还能脑补
Google DeepMind等机构提出的新视频分层模型无需假设静态背景或精确相机姿态,可分离前景对象和背景,并生成高质量分解结果。该方法利用视频扩散模型及三元掩码技术,增强了遮挡区域补全能力,提升了视频编辑效率和直观性。
谷歌发布世界模型Genie 2!一键生成3D游戏,人和AI都能玩,时长多达1分钟
Google DeepMind发布Genie 2,能生成3D交互环境用于训练具身agent,展示了基础世界模型的潜力和优势。
刚刚,谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础
ViT三大核心作者翟晓华、卢卡斯·拜尔和亚历山大·科列斯尼科夫集体离职谷歌DeepMind,加入OpenAI。他们在计算机视觉领域的研究包括ViT及其衍生工作、SigLIP、PaliGamma等。