极市干货
一次搞定自驾场景的可控生成和长时序生成?科大和地平线提出DrivingWorld:基于视频GPT构建自动驾驶世界模型
DrivingWorld模型通过创新的空间-时间解耦机制和高效的编码解码模块,实现了自动驾驶场景的可控生成和超长时间视频生成。该研究由香港科技大学与地平线联合完成,论文、代码均开放获取。
视频任意门来了!港大&达摩院新作VideoAnydoor:向视频无缝传送物体,同时支持准确动作控制
↑ 点击
蓝字
关注极市平台
作者丨CVer粉丝投稿
来源丨CVer
编辑丨极市平台
极市导读
香港