Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布
中国研究员联合DeepMind团队提出的新研究《Lavender: Diffusion Instruction Tuning》,通过“注意力对齐”让Stable Diffusion教Llama-3.2等模型“看图说话”,性能提升30%,且代码、模型、训练数据将全部开源。
中国研究员联合DeepMind团队提出的新研究《Lavender: Diffusion Instruction Tuning》,通过“注意力对齐”让Stable Diffusion教Llama-3.2等模型“看图说话”,性能提升30%,且代码、模型、训练数据将全部开源。
一款名为1Prompt1Story的开源项目解决了角色一致性问题,适用于文生图模型生成角色一致性的场景。它能自动生成长提示词,并利用先进技术确保角色在多个图像中的统一性,支持漫画、小说插图和游戏角色设计等多领域。
OpenAI 推出 Sora 视频生成模型,支持用户创建最长 20 秒超现实视频内容。目前对公众开放使用,但注册功能暂时无法使用。Sora 被整合进现有的订阅服务中,并将免费提供给 Plus 用户。
斯坦福大学教授李飞飞发布了她的第一个创业项目World Labs,用户可以通过单张图片或一句话生成3D世界。这是生成式AI进入3D完全沉浸式新时代的一个例子。
黑森林工作室获得2亿美元融资,推出文生图模型FLUX.1,其参数训练量达到12B,支持自然语言生成,效果逼真且在多种应用中超越其他热门模型。