物理世界大考翻车?STI-Bench揭多模态大模型短板:顶尖模型准确率不足42% 下午4时 2025/04/17 作者 PaperWeekly Driving)的端到端解决方案已成为主流趋势,并在视觉语义理解任务中取得了显著进展。 然而,它们在