字节团队归档

字节开源新生图模型：一个模型统一所有生图任务，多主体融合效果SOTA

下午4时 2025/04/10 作者量子位

字节团队提出UNO模型，能处理多主体图像生成任务。该模型基于FLUX改进，解决了数据可扩展性和主体可扩展性问题，并在DINO和CLIP得分上达到SOTA水平。

AAAI 2025 高效桥接视觉和语言，字节、中大提出全新多模态大模型连接器

上午8时 2025/01/21 作者 PaperWeekly

字节团队与中山大学合作提出的 ParGo 模型，通过融合全局视野和局部细节来高效连接视觉特征和语言模型（LLM），在多项基准测试中表现优异，并被选为 AAAI 2025 的入选论文。

如何高效桥接视觉和语言，字节&中大提出全新多模态大模型连接器ParGo

下午4时 2025/01/11 作者机器之心

字节团队与中山大学合作提出的ParGo模型通过巧妙融合全局视野和局部细节，在多模态大语言模型中表现出色，成功入选AAAI2025。ParGo采用Partial-Global Perception Block和Cascaded Partial Perception Block模块，结合全局视角和局部细节处理视觉特征，有效提升了LLM的效果。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30