单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节
FlexWorld团队提出一种新方法,通过合成和整合新的3D内容逐步构建灵活视角的3D场景。该方法结合了微调的视频到视频扩散模型和几何感知的3D场景扩展过程,能够有效生成大幅度相机变化下的高质量3D场景。
FlexWorld团队提出一种新方法,通过合成和整合新的3D内容逐步构建灵活视角的3D场景。该方法结合了微调的视频到视频扩散模型和几何感知的3D场景扩展过程,能够有效生成大幅度相机变化下的高质量3D场景。
人大高瓴人工智能团队提出Think-Then-React框架,通过预训练大语言模型和解耦空间位姿编码策略,实现更准确的人类动作到反应生成。