2025年2月12日23时 - 第6页共11页

Cell子刊《Patterns》最新综述：大语言模型Attention Heads的可解释性研究

2025年2月12日23时作者 PaperWeekly

大语言模型（LLMs）的注意力头功能与工作机制引起了广泛关注。《Attention Heads of Large Language Models》综述论文整合了现有研究，提出四阶段认知框架和详细分类，并梳理实验方法与评估基准，为LLM可解释性研究提供了系统性的理论支持与实践指导。

2025年2月12日23时作者机器之心

50B 的性能。
这是一种全新的语言模型架构，能够通过使用循环语言模型在潜在空间中隐式推理，显著提升

2025年2月12日23时作者智东西

苹果正在与中国互联网巨头阿里巴巴合作开发中国版AI功能。此前曾考虑百度，但因DeepSeek团队缺乏支持大型客户的资源和技术经验而放弃。

2025年2月12日23时作者新智元

国优先」，不接受任何国家的强加监管，拒签70多个国家和组织参与的「AI宣言」。欧洲「背水一战」，斥资

2025年2月12日23时作者智东西

DeepSeek已集成至上百款应用，涵盖金融、教育、医疗等多个场景。开发者可通过满血版和蒸馏小模型等选择接入，提高用户体验。

2025年2月12日23时作者 PaperWeekly

的 Gemini、DeepSeek 和 Qwen-QwQ 等，通过模拟人类推理过程，在多个专业领域

2025年2月12日23时作者极市干货

径比较清晰，意在初步梳理DeepSeek技术的演进及进化之路，主要包括三大方向：大语言模型、视觉语言

2025年2月12日23时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

2025年2月12日23时作者智东西

近日，OpenAI联合创始人、前特斯拉AI总监、知名计算机科学家李飞飞的爱徒安德烈·卡帕西（Andr

2025年2月12日23时作者新智元

消息：DeepSeek的估值竟已飙至1500亿美元，已经达到OpenAI的一半？在巴黎AI峰会现场，