LLM 自回归做理解,MaskGIT 方案做生成!VILA‑U:一个模型搞定图像理解、视频理解和生成,简洁而强大 2025年6月9日23时 作者 极市干货 kGIT 方案做生成的生成理解统一模型。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 太长