Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品 2025年4月28日16时 作者 量子位 何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense ,系统评测多
多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格 2025年1月2日12时 作者 量子位 LongDocURL团队 投稿 量子位 | 公众号 QbitAI GPT -4 o仅得分64.5 ,