Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品 下午4时 2025/04/28 作者 量子位 何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense ,系统评测多
多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格 下午12时 2025/01/02 作者 量子位 LongDocURL团队 投稿 量子位 | 公众号 QbitAI GPT -4 o仅得分64.5 ,