生成模型
字节开源了一个新型多模态生成模型 Liquid
字节开源新型多模态生成模型Liquid,核心创新在于统一编码图像和文本到相同token空间,并使用单一LLM处理视觉理解和生成任务。研究表明,随着模型规模增大,性能下降会消失甚至互相促进。
Adobe黑科技:视频扩散降维图像编辑,ObjectMover秒懂物理规律
论文提出的新模型ObjectMover结合视频扩散模型和虚幻引擎合成数据,实现了图像中物体的真实感移动。它不仅能处理物体的插入、删除和移动任务,还能有效保持物体的身份特征及光照效果。
华为诺亚综述:生成式模型如何用于决策?
华为诺亚决策推理实验室综述了生成模型在智能决策中的应用。文章介绍了七种主要的生成模型,并探讨了它们如何在机器人控制、结构优化、游戏 AI 和优化问题等领域中提升决策性能。
何恺明开辟分形图像生成新范式!计算效率提高4000倍,首次实现高分辨率逐像素生成
何恺明团队提出分形生成模型Fractal Generative Models,通过递归调用原子生成模块实现逐像素高分辨率图像生成。该模型从数据中学习递归法则,展示在材料、蛋白质等非序列数据建模中的潜力,并已开源代码。
赶紧放弃强化学习?!Meta 首席 AI 科学家杨立昆喊话:当前推理方式会“作弊”,卷大模型没有意义!
这样的困境:它们基于深度学习架构,通过在大规模数据上进行预训练、调整参数,看似构建起了对世界的“理解