挖掘DiT的位置解耦特性,Personalize Anything免训练实现个性化图像生成

本文介绍了一种全新的架构设计 Personalize Anything,它能够在无需训练的情况下完成概念主体的高度细节还原,并支持位置控制和多种应用。通过创新的标记替换机制和特征扰动技术,团队展示了其在保真度、可控性和多功能性上的优势,并将其应用于布局引导生成、多物体组合等场景。

小米汽车首曝自动驾驶研究:相机和LiDAR联合重建框架Uni-Gaussians

论文提出Uni-Gaussians方法,利用高斯基元实现相机与激光雷达数据的联合重建。该方法在Waymo公开数据集上评估表现优异,能够准确模拟动态驾驶场景中的各种移动实体,并保持高质量渲染质量。