GitHub一周2000星!国产统一图像生成模型神器升级,理解质量双up,还学会了“反思”

国产开源统一图像生成模型OmniGen2发布,显著增强了上下文理解能力、指令遵循能力和图像生成质量。它支持文生图、图像编辑和主题驱动图像生成,并通过全面开源训练数据和权重等资源促进开发者参与。

字节图像生成新模型:主打多主体一致性,新基准数据集同时亮相

字节发布多主体控制生成模型Xverse,可以精确控制多个主体的身份和语义属性。该模型包括T-Mod适配器、文本流调制机制、VAE编码图像特征模块及正则化技术等关键部分,并通过XVerseBench基准测试验证其效果。