出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资

世界模型 Odyssey 的生成式世界模型 Explorer 进一步展示了照片级真实感的世界,支持运动、高斯溅射等特性,并强调了故事和创作者的重要性。该公司在 1800 万美元 A 轮融资后推出 Explorer,计划将其应用于电影和游戏等领域。

在线试玩 对齐、生成效果大增,文本驱动的风格转换迎来进阶版

AIxiv专栏介绍了西湖大学研究团队提出的StyleStudio,它解决文本驱动的风格迁移中的内容泄漏和不可控的问题。论文提出了跨模态自适应实例正则化技术、基于风格图像的无分类器生成引导以及引入教师模型稳定图像生成三个贡献。实验显示其在文本对齐能力和布局稳定性方面优于现有方法。