AI PS卷起来了!谷歌Gemini动嘴P图火出圈,马斯克Grok连夜上线图像编辑

Grok连夜上线图片编辑功能,通过文字描述即可实现高级P图效果,如让证件照换西服、黑发变金发。Gemini的火爆引发AI巨头内卷加剧,大模型正降低图片编辑技术门槛,未来可能带来工作范式转移。

Gemini 2.0 原生绘画能力惊艳我了,兑现了我对 GPT-4o 曾经的幻想!

MLNLP社区介绍了谷歌 Gemini 2.0系列模型的原生多模态输出能力,特别是其绘画功能。Gemini 2.0实现了文本与图像的一致生成,并通过多次对话实现复杂场景的精细调整。Gemini 2.0在保持一致性方面表现出色,可应用于电商批量生成图片、产品设计等多个领域。