LaVin-DiT 归档 - 每时AI

无需微调即可适应20多种视觉任务！爱诗科技与悉尼大学联合推出LaVin-DiT：大规模视觉扩散Transformer

2024年12月4日23时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨王兆卿博士悉尼大学，爱诗科技
研究方向｜视觉表征学习，多模态表

爱诗科技与悉尼大学联合发布大视觉模型LaVin-DiT，统一多项视觉任务

2024年12月3日14时作者 PaperWeekly

研究问题
当前的 Large Vision Models 多为直接从自然语言处理架构改编，但这些模型