视觉分词器归档 - 每时AI

简单却强大！端到端视觉Tokenizer调优让多模态任务性能飙升！智源&卢湖川团队等发布ETT

2025年5月20日23时作者极市干货

本文
提出了一种端到端视觉分词器调优方法ETT，通过联合优化分词器的重建目标和下游任务目标，并利用码

ICLR 2025 从碎片到完整：面向语义完整且等价的多模态视觉分词新范式SeTok

2025年5月7日16时作者 PaperWeekly

ion tokenization）作为视觉与语言语义对齐的关键环节，发挥着至关重要的作用。
然而，现