Stable Diffusion 归档 - 第2页共2页

Llama模仿Diffusion多模态涨分30%！不卷数据不烧卡，只需共享注意力分布

2025年2月17日12时作者量子位

中国研究员联合DeepMind团队提出的新研究《Lavender: Diffusion Instruction Tuning》，通过“注意力对齐”让Stable Diffusion教Llama-3.2等模型“看图说话”，性能提升30%，且代码、模型、训练数据将全部开源。

2025年2月7日8时作者开源星探

一款名为1Prompt1Story的开源项目解决了角色一致性问题，适用于文生图模型生成角色一致性的场景。它能自动生成长提示词，并利用先进技术确保角色在多个图像中的统一性，支持漫画、小说插图和游戏角色设计等多领域。

2024年12月10日10时作者 AI大模型实验室

OpenAI 推出 Sora 视频生成模型，支持用户创建最长 20 秒超现实视频内容。目前对公众开放使用，但注册功能暂时无法使用。Sora 被整合进现有的订阅服务中，并将免费提供给 Plus 用户。

2024年12月3日12时作者 Founder Park

斯坦福大学教授李飞飞发布了她的第一个创业项目World Labs，用户可以通过单张图片或一句话生成3D世界。这是生成式AI进入3D完全沉浸式新时代的一个例子。

2024年11月29日21时作者 Founder Park

黑森林工作室获得2亿美元融资，推出文生图模型FLUX.1，其参数训练量达到12B，支持自然语言生成，效果逼真且在多种应用中超越其他热门模型。