阿里最新多模态统一理解与生成模型:Qwen VLo

阿里最新多模态统一理解与生成模型:Qwen VLo,图片理解生成能力更强。Qwen VLo在原始多模态理解与生成能力基础上进行了升级,增强了对图像的理解深度,生成更准确,一致性更强。

  • 可以生成图像、编辑再创作图像、生成海报、组合物体等

  • 后面它还会上线多图输入、极端长宽比图像生成功

  • 支持开放指令编辑生成,可以说“给这张图片添加一个晴朗的天空”

  • 支持中、英文

  • 目前放出的是预览版本,可在Qwen Chat体验

参考文献:
[1] 体验地址:https://chat.qwen.ai/
[2] 博客: https://qwenlm.github.io/blog/qwen-vlo/



知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群

(文:NLP工程化)

发表评论