高质量图像归档

ICML 2025 何恺明团队提出：高度压缩的Tokenizer可直接用于图像生成

2025年7月22日23时作者极市干货

本文提出仅用32个一维离散 token 的高度压缩 TiTok tokenizer，无需训练额外生成模型，通过测试时梯度优化即可完成图像生成、编辑和修复任务。发现极致压缩提高了生成质量，挑战了传统“先压缩后生成”范式。

2025年5月23日8时作者开源星探

字节跳动发布的BAGEL是首个支持多模态输入输出、思维链推理和MOT架构优化的跨模态超级AI模型，性能超越Qwen2.5-VL、InternVL-2.5。它能理解图像更准确，生成图像媲美Stable Diffusion 3，并在10+基准测试中表现优异。

2025年5月14日11时作者路过银河AI

今天分享了一个名为Illustrious NoobAI的动漫2.5D风格优秀模型，提供了多种提示词以生成不同场景和角色的艺术作品。

2025年5月5日11时作者路过银河AI

这是一个高性能的checkpoint，适用于低配置电脑生成图像。它能够减少双下巴等瑕疵，并且保持SFW和NSFW内容的质量平衡。作者提供了一些示例图片来展示模型的能力。

2025年2月19日23时作者极市干货

sfusion 的多模态模型，它通过结合语言建模（文本）和扩散模型（图像）的训练目标，实现了在单一模

2024年12月20日8时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨AI生成未来
来源丨AI生成未来
编辑丨极市平台
极市导读
本文

2024年12月17日12时作者硅星人Pro

作者
｜
Jessica
邮箱
｜
JessicaZhang@pingwest.com
新的一周，O