可解释性归档 - 每时AI

基于超176k铭文数据，谷歌DeepMind发布Aeneas，首次实现古罗马铭文的任意长度修复

2025年7月25日8时作者 HyperAI超神经

3 日，谷歌 DeepMind 的研究人员联合诺丁汉大学、华威大学等高校在国际顶尖学术期刊 Natu

刚刚，OpenAI发布CoT监控，增强AI Agent自主能力

2025年7月16日8时作者 AIGC开放社区

专注AIGC领域的专业社区关注最新进展。OpenAI发布思维链监控技术，帮助监督AI智能体并提高其透明度和可解释性。

Bengio亲手戳穿CoT神话！LLM推理是假象，25％顶会论文遭打脸

2025年7月3日14时作者机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

只训练数学，却在物理化学生物战胜o1！新强化学习算法带来显著性能提升，还缓解训练崩溃问题

2025年6月23日16时作者量子位

模型推理能力再添例证。
来自上海创智学院、上海AI Lab的MM-Eureka系列工作提出了新的强化

大模型到底是怎么「思考」的？第一篇系统性综述SAE的文章来了

2025年6月22日16时作者机器之心

本文是关于Sparse Autoencoder（SAE）综述的系统介绍，讨论了SAE在理解大语言模型内部机制和实际应用方面的优势与挑战。

Anthropic祭出大模型“读脑”杀手锏：LLM决策过程全给你扒开看

2025年5月30日8时作者 AI寒武纪

Anthropic开源了一款新的电路追踪工具，能够生成大型语言模型的归因图谱，帮助研究人员更好地理解这些模型内部运作机制。

官宣：Mira Murati 的创业公司，顶级团队打造开放的 OpenAI

2025年2月19日12时作者 Founder Park

前 CTO、核心主创之一的
Mira Murati，终于官宣了她的创业公司。
Thinking Ma

首个基于统计学的线性注意力机制ToST，高分拿下ICLR Spotlight

2025年2月17日12时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，