图像生成
GPT-4o 生图实测:很强(附:20+场景示例 & 缺陷整理)
ChatGPT通过4o模型发布新功能,能够生成高质量图像,并根据对话进行修改。它能处理复杂的场景、风格多样且指令遵循能力强。然而,也存在一些限制和潜在问题。
告别PS!Gemini 2.0这AI生图绝了,动动嘴就P出大片!
文章介绍了Gemini 2.0原生绘画能力的突破,包括“对话式图像编辑”和“一致性生成”功能。Gemini 2.0能够通过简单的文本指令实现复杂的图像修改,并且能连续生成风格一致的内容。尽管存在一些小瑕疵,但其潜力巨大,目前已提供免费体验机会。
无需训练让扩散模型提速2倍,上交大提出Token级缓存方案|ICLR‘25
上海交通大学张林峰团队提出Toca方法,通过token粒度的缓存策略实现无需训练的图像和视频生成加速,相比现有方法具有更强适配性和优异性能。