CVPR 2025:长Prompt对齐问题也能评估了!当前最大AIGC评估数据集,模型评分超越当前SOTA
上海交通大学-美团计算与智能联合实验室的论文被CVPR录用,提出Q-Eval-100K数据集与Q-Eval-Score评估框架解决文本到视觉模型质量评估问题。该数据集包含大量高质量AIGC生成数据,并通过多种策略提高评估精度。
上海交通大学-美团计算与智能联合实验室的论文被CVPR录用,提出Q-Eval-100K数据集与Q-Eval-Score评估框架解决文本到视觉模型质量评估问题。该数据集包含大量高质量AIGC生成数据,并通过多种策略提高评估精度。
AI玩具市场快速增长,多家企业发布新品。实丰文化推出’AI魔法星’,奥飞娱乐推出’喜羊羊超能铃铛娃娃’等产品。嘉之亨和孩子王也相继进入该领域,行业前景看好。
全球首个机器人在室内外多场景连续空翻的视频公布,价格仅3.99万起。这款名为N2的人形机器人由清华系创业公司NOETIX Robotics松延动力研发,具备大步行走、奔跑、单双脚跳跃等多种运动能力。
Google发布的新工具Gemini(或称Imagen3)在自然语言的理解和材质质感复现方面表现优秀。文章通过四个测试案例详细介绍了其能力边界,包括正方体的材质变换、从手绘稿生成设计渲染图、一次性生成多套不同风格的设计以及抠图换背景打光影等功能。
本文提出VLM²-Bench评测基准,旨在系统探究视觉语言模型在人类级基础视觉线索关联能力上的表现。通过全面考察通用线索、物体线索和人物线索三个大类的基础关联能力,共涵盖9个子任务及3060个测试案例。