效果非常不错!阿里昨开源图形海报生成模型Qwen-Image

Qwen-Image 是一款基于20B参数MMDiT架构的多模态图像基础模型,能在复杂文本渲染和精确图像编辑方面实现重大突破。它特别擅长中文文本渲染,并具备高保真文本渲染、多种艺术风格生成及智能图像编辑等核心能力。

95后北大校友挑起ChatGPT Agent大梁!今年刚博士毕业,曾获陶哲轩支持的AIMO第二名

OpenAI发布会C位被华人占据,孙之庆、马丁(MengTian)李和张熙堃等华人员工参与重要项目。小扎挖角多名OpenAI研究员后引起关注,首席研究官Mark Chen离职加入Meta,Alexandr Wang成为全球最年轻的亿万富豪之一。

GitHub一周2000星!国产统一图像生成模型神器升级,理解质量双up,还学会了“反思”

国产开源统一图像生成模型OmniGen2发布,显著增强了上下文理解能力、指令遵循能力和图像生成质量。它支持文生图、图像编辑和主题驱动图像生成,并通过全面开源训练数据和权重等资源促进开发者参与。

TransDiff–最简洁的AR Transformer + Diffusion图像生成方法

本文介绍了一种新的图像生成方法TransDiff,它结合了AR Transformer和Diffusion模型,并提出了Multi-Reference Autoregression(MRAR)范式。TransDiff使用较小的Diffusion Decoder显著降低参数量,同时在基准测试中表现出色。