ICLR 2025 扩散模型奖励微调新突破!Nabla-GFlowNet让多样性与效率兼得
本文介绍了一种基于生成流网络的扩散模型奖励微调方法Nabla-GFlowNet,该方法能够在快速收敛的同时保持生成样本的多样性和先验特性。通过在Stable Diffusion上实验验证了其有效性。
本文介绍了一种基于生成流网络的扩散模型奖励微调方法Nabla-GFlowNet,该方法能够在快速收敛的同时保持生成样本的多样性和先验特性。通过在Stable Diffusion上实验验证了其有效性。
Midjourney推出的新版V7注重图像的真实感提升,并在细节真实性、场景理解及专业拍摄风格适配方面进行了优化。但个性化创作受限于数据学习和用户满意度提高有限问题。同时,新增的草图模式提升了生成速度,但也带来了一些质量上的挑战。
AI Toolkit 是一款开源工具包,专注于Stable Diffusion模型训练,提供优化的训练脚本、FLUX.1训练方案、多平台支持以及可视化操作界面等特性。
中国研究员联合DeepMind团队提出的新研究《Lavender: Diffusion Instruction Tuning》,通过“注意力对齐”让Stable Diffusion教Llama-3.2等模型“看图说话”,性能提升30%,且代码、模型、训练数据将全部开源。
一款名为1Prompt1Story的开源项目解决了角色一致性问题,适用于文生图模型生成角色一致性的场景。它能自动生成长提示词,并利用先进技术确保角色在多个图像中的统一性,支持漫画、小说插图和游戏角色设计等多领域。
OpenAI 推出 Sora 视频生成模型,支持用户创建最长 20 秒超现实视频内容。目前对公众开放使用,但注册功能暂时无法使用。Sora 被整合进现有的订阅服务中,并将免费提供给 Plus 用户。
斯坦福大学教授李飞飞发布了她的第一个创业项目World Labs,用户可以通过单张图片或一句话生成3D世界。这是生成式AI进入3D完全沉浸式新时代的一个例子。