扩散模型归档 - 第6页共12页

U-Net和ViT凑一块，会发生什么？U-REPA：精准对齐Diffusion U-Net与ViT特征空间，训练提速42%

2025年4月14日23时作者极市干货

U-Net 架构对齐到 ViT（Vision Transformer）特征空间
的新方法
U-REP

ICLR 2025 扩散模型奖励微调新突破！Nabla-GFlowNet让多样性与效率兼得

2025年4月13日23时作者 PaperWeekly

本文介绍了一种基于生成流网络的扩散模型奖励微调方法Nabla-GFlowNet，该方法能够在快速收敛的同时保持生成样本的多样性和先验特性。通过在Stable Diffusion上实验验证了其有效性。

英伟达华人AI版《猫和老鼠》爆火全网，60秒经典泪目！仅靠Transformer新增一层

2025年4月10日11时作者新智元

TTT打造了一分钟视频生成器，让汤姆和杰瑞的追逐战延续到全新篇章，技术与经典的完美碰撞，你准备好迎接

DiT控制新纪元！”即插即控”，Tiamat AI重磅开源EasyControl：任意比例出图+推理速度狂飙

2025年4月4日11时作者极市干货

个面向DiT模型的条件生成框架
EasyControl
，通过条件注入LoRA模块、位置感知训练范式

GPT-4o图像生成的秘密，OpenAI 没说，网友已经拼出真相？

2025年3月29日16时作者机器之心

GPT-4o 图像生成引起了广泛兴趣和猜测，OpenAI仅发布系统卡附录详细评估、安全和治理。网络上流传多种猜想及逆向工程猜测其可能采用自回归+扩散或非扩散的自回归生成方式。

单张照片生成360°3D场景，支持灵活视角漫游｜人大&北师大&字节

2025年3月28日23时作者量子位

FlexWorld团队提出一种新方法，通过合成和整合新的3D内容逐步构建灵活视角的3D场景。该方法结合了微调的视频到视频扩散模型和几何感知的3D场景扩展过程，能够有效生成大幅度相机变化下的高质量3D场景。

爆火Block Diffusion引发LLM架构变革？自回归+扩散模型完美结合 ICLR 2025

2025年3月25日11时作者新智元

散模型的优势，解决了现有扩散模型生成长度受限、推理效率低和生成质量低的问题。通过块状扩散实现任意长度

无需百卡集群！港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

2025年3月19日8时作者机器之心

LightGen 是由香港科技大学 Harry Yang 教授团队联合 Everlyn AI 和 UCF 提出的一种新型高效图像生成模型，旨在解决主流生成模型依赖大量数据和计算资源的问题。论文提出通过知识蒸馏和直接偏好优化策略，在有限的数据和计算资源下实现了高质量图像的生成，并在多个实验中展示了与 SOTA 模型相当甚至超过的性能表现。

2025 年 11 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30