量子位，作者每时AI - 第47页共151页

AI记忆系统首获统一框架！6大操作让大模型拥有人类记忆能力

2025年5月31日16时作者量子位

始拥有“
记忆力”——
我们该如何重新定义智能？
来自香港中文大学、爱丁堡大学、
香港科技大学与华为

2025年5月31日16时作者量子位

，避免“近视”？
360人工智能研究团队提出了
FG-CLIP
，可以明显缓解CLIP的“视觉近视”

2025年5月31日16时作者量子位

路追踪
”
（circuit tracing）
工具，可以帮大伙儿
读懂大模型的“脑回路”
，追踪其

2025年5月30日16时作者量子位

香港中文大学与新加坡国立大学的研究者提出了一种名为TON的新颖选择性推理框架，让视觉语言模型可以自主判断是否需要显式推理。该方法显著减少了生成的思考链长度，提高了模型推理过程的效率，并且在不牺牲准确率的前提下提升了响应多样性。

2025年5月30日16时作者量子位

怪。
最近来自中国科学技术大学、香港城市大学和浙江大学的联合研究团队，通过对多个语言模型、任务序列和

2025年5月30日16时作者量子位

上海人工智能实验室等团队发布全新图像编辑评测基准RISE，评估了九个视觉编辑模型的复杂指令理解和执行能力。结果显示GPT-4o-Image仅能完成28.9%的任务，显著低于预期；RISEBench覆盖时间、因果、空间和逻辑四种核心推理类型，为视觉编辑模型的发展提供了新的视角。

2025年5月30日16时作者量子位

新模型FLUX.1 Kontext能接受文本和图像输入，具备角色一致性、局部编辑等特性。它被用于生成与修改上下文相关的图像，并通过官方试玩平台Flux Playground提供两种型号供选择。

2025年5月30日16时作者量子位

K，短短2秒钟时间，一个
准万亿MoE大模型
就已经吃透如何解一道
高等数学大题
了！
而且啊，这个

2025年5月30日16时作者量子位

MME-VideoOCR团队评估MLLM在视频OCR中的能力，构建精细任务体系和高质量数据集，揭示了当前模型的局限性，并提出了优化建议。

2025年5月30日16时作者量子位

上海人工智能实验室联合团队提出Avengers框架，通过四个轻量步骤集合多个小型模型实现复杂任务的高效解决。结果证明，在无需额外训练的情况下，Avengers框架能够达到甚至在某些方面超越顶尖大型模型的水平。