注意力机制归档 - 第4页共5页

阶跃公开了自家新型注意力机制：KV缓存消耗直降93.7%，性能不减反增

2025年1月17日16时作者机器之心

研究提出多矩阵分解注意力（MFA）及其变体 MFA-Key-Reuse，大幅降低语言模型推理成本的同时实现性能提升。

2025年1月16日23时作者 AI寒武纪

谷歌发布的新架构Titans引入了神经长期记忆模块，能够在测试时学习记忆，提高模型上下文长度的同时保持快速推理能力。

2025年1月10日8时作者 NLP工程化

GitHub 上的 awesomeMLSys 提供了机器学习入门的学习资源列表，涵盖多个方面的内容，帮助深入学习和理解机器学习。

2025年1月6日16时作者 PaperWeekly

©PaperWeekly 原创 · 作者 |
李重仪
单位 |
南开大学教授
研究方向 |
计算机视

2024年12月31日14时作者 AI探索时代

编码器是神经网络模型的一部分，用于将输入数据映射到更紧凑的特征空间。它们通常是任务驱动的模块，由多个神经网络组件组成。

MLNLP
社区是国内外知名的机器学习与自然语言处理社区，受众覆盖国内外NLP硕博生、高校老师以及企

2024年12月18日14时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

2024年12月13日12时作者新智元

新智元报道
编辑：LRS
【新智元导读】
Transformer模型自2017年问世以来，已成为AI

2024年12月12日8时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨Xin He等
来源丨自动驾驶之心
编辑丨极市平台
极市导读
本