图像生成归档

效果非常不错!阿里昨开源图形海报生成模型Qwen-Image

2025年8月5日23时作者 GitHubStore

Qwen-Image 是一款基于20B参数MMDiT架构的多模态图像基础模型，能在复杂文本渲染和精确图像编辑方面实现重大突破。它特别擅长中文文本渲染，并具备高保真文本渲染、多种艺术风格生成及智能图像编辑等核心能力。

2025年8月5日12时作者量子位

通义模型家族开源Qwen-Image，一个200亿参数的图像生成基础模型。主打复杂文本渲染能力，能准确生成图文混合布局、海报等高质量图像，并在多项公开基准测试中表现出色。

2025年8月4日23时作者 PaperWeekly

扩散模型（Diffusion Models）凭借出色的生成质量，迅速成为图像、视频、语音、3D 内容

2025年7月25日8时作者极市干货

标即可训练，既保持了 MLLM 的理解实力，又在图像生成任务上达到了强劲表现，包括图像编辑和主体驱动

2025年7月20日16时作者量子位

OpenAI发布会C位被华人占据，孙之庆、马丁（MengTian）李和张熙堃等华人员工参与重要项目。小扎挖角多名OpenAI研究员后引起关注，首席研究官Mark Chen离职加入Meta，Alexandr Wang成为全球最年轻的亿万富豪之一。

2025年7月3日16时作者量子位

国产开源统一图像生成模型OmniGen2发布，显著增强了上下文理解能力、指令遵循能力和图像生成质量。它支持文生图、图像编辑和主题驱动图像生成，并通过全面开源训练数据和权重等资源促进开发者参与。

2025年6月29日8时作者 NLP工程化

Flux Kontext Dev ComfyUI 首日支持发布，提供强力图像编辑能力，整合了角色一致性生成、本地运行等特性，提升创作者和开发者的创作自由度与可控性。

2025年6月20日23时作者极市干货

Meta等机构发布Pisces模型，它采用“双脑架构”，通过解耦视觉编码架构和三阶段渐进训练策略，实

2025年6月19日16时作者 APPSO

晨顶着压力推出了首个视频模型
V1
。
调色精准、构图考究、情绪饱满，风格依旧在线。
不卷分辨率、不