近千个反现实视频构建了「不可能」基准,哪个AI不服?来战!
新加坡国立大学的研究团队提出了Impossible Videos概念,构建了包含多种不可能场景的基准IPV-BENCH,用于评测AI视频生成和理解能力。研究发现当前模型在生成和识别不可能事件方面存在挑战,并指出了未来改进的方向。
新加坡国立大学的研究团队提出了Impossible Videos概念,构建了包含多种不可能场景的基准IPV-BENCH,用于评测AI视频生成和理解能力。研究发现当前模型在生成和识别不可能事件方面存在挑战,并指出了未来改进的方向。
出MMKE – Bench,这是史上最全面的多模态知识编辑基准,涵盖跨越33个广泛的类别视觉实体编辑
UC San Diego团队通过实验验证GPT-4.5不仅通过了图灵测试,其表现甚至超过真人。胜率高达73%,远高于对照组人类对手的50%。研究发现人设提示是关键因素。