大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降 ICML’25 2025年7月20日16时 作者 新智元 ! 基于工作记忆的认知测试显示,LLM的上下文检索存在局限。在一项人类稳定保持高正确率的简单检索任务