模型遗忘不代表记忆抹除!首次系统发现「可逆性遗忘」背后规律 下午4时 2025/06/14 作者 新智元 研究人员首次揭示了大模型在机器遗忘过程中的表示结构变化规律,通过构建统一的表示层分析工具箱,系统性地区分可逆性和不可逆遗忘的本质差异。
AI自己给自己当网管,实现安全“顿悟时刻”,风险率直降9.6% 下午4时 2025/06/13 作者 量子位 研究团队提出SafeKey框架,通过双通路安全头和查询遮蔽建模提升大模型的安全稳健性,显著降低了危险率。