PaperWeekly，作者每时AI - 第32页共45页

0.5B小模型逆袭！不到50元，「X-R1」让每个人都能复现Aha Moment

2025年2月13日12时作者 PaperWeekly

X-R1 是一个低成本且易入门的强化学习训练框架，旨在降低 R1 的复现门槛。通过使用0.5B预训练模型，在4张3090/4090显卡上仅需2小时就实现了 ‘aha Moment’，展示了极小模型也能触发Aha Moment的现象。

2025年2月13日12时作者 PaperWeekly

图神经网络、协同感知
论文题目：
SAMGPT: Text-free Graph Foundati

2025年2月12日23时作者 PaperWeekly

大语言模型（LLMs）的注意力头功能与工作机制引起了广泛关注。《Attention Heads of Large Language Models》综述论文整合了现有研究，提出四阶段认知框架和详细分类，并梳理实验方法与评估基准，为LLM可解释性研究提供了系统性的理论支持与实践指导。

2025年2月12日23时作者 PaperWeekly

的 Gemini、DeepSeek 和 Qwen-QwQ 等，通过模拟人类推理过程，在多个专业领域

2025年2月12日23时作者 PaperWeekly

文章介绍了字节跳动豆包大模型团队提出的新稀疏模型架构 UltraMem，该架构有效解决了 MoE 推理时高额的访存问题，推理速度提升2-6倍，成本降低83%。

2025年2月11日23时作者 PaperWeekly

AGI 的重要问题。一些工作
[1, 2]
发现通过引入安全相关的外部监督信号对大模型进行微调可以让

2025年2月10日16时作者 PaperWeekly

哈工大深圳、鹏城实验室和昆士兰大学合作提出了一种极性感知线性自注意力机制（Polarity-aware Linear Attention），解决了现有方法在保证注意力分数正值性时会忽视掉 Q,K 矩阵中的负值元素的问题，并在多个视觉任务上取得了精度与效率的平衡。

2025年2月10日16时作者 PaperWeekly

ICML投稿创纪录，咕泡科技提供一站式论文辅导服务。随着学术竞争加剧，高质量论文成为保研、申博和就业的重要凭证。咕泡科技汇聚顶尖导师资源，覆盖AI全方向和交叉学科，从选题到发表全程指导，助力学员克服挑战，提升论文质量与发表成功率。

2025年2月10日19时2025年2月10日16时作者 PaperWeekly

k：技术原理与未来方向“的线上研讨会。清华大学长聘副教授、面壁智能首席科学家刘知远老师作为主讲嘉宾之

2025年2月10日12时作者 PaperWeekly

网络
前两年福至心灵之下，开了一个“Transformer 升级之路”系列，陆续分享了主流 Tran