CVPR 2025:长Prompt对齐问题也能评估了!当前最大AIGC评估数据集,模型评分超越当前SOTA

上海交通大学-美团计算与智能联合实验室的论文被CVPR录用,提出Q-Eval-100K数据集与Q-Eval-Score评估框架解决文本到视觉模型质量评估问题。该数据集包含大量高质量AIGC生成数据,并通过多种策略提高评估精度。

颤抖吧设计师!谷歌文生图AI爆冲行业:真·用嘴改图,附9大实用案例

Google发布的新工具Gemini(或称Imagen3)在自然语言的理解和材质质感复现方面表现优秀。文章通过四个测试案例详细介绍了其能力边界,包括正方体的材质变换、从手绘稿生成设计渲染图、一次性生成多套不同风格的设计以及抠图换背景打光影等功能。

人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板

本文提出VLM²-Bench评测基准,旨在系统探究视觉语言模型在人类级基础视觉线索关联能力上的表现。通过全面考察通用线索、物体线索和人物线索三个大类的基础关联能力,共涵盖9个子任务及3060个测试案例。