自注意力机制归档 - 每时AI

ICCV 2025｜FreeMorph：无需训练、30 秒完成高质量图像 morphing

2025年7月18日23时作者极市干货

出 FreeMorph：无需训练、30 秒完成高质量图像 morphing，仅靠改进 Stable

蚂蚁集团开源的Ming-Lite-Omni：多模态大模型的“全能王”，你不可不知！

2025年6月10日14时作者小兵的AI视界

-Omni
模型以其强大的多模态感知和生成能力，为
AI
领域带来了新的突破。本文将详细介绍
Min

CVPR 25 全面提升视觉感知鲁棒性，生成模型快速赋能三维检测

2025年5月23日16时作者机器之心

院，导师为李镇老师。目前实验室的研究方向包括：自动驾驶、医学成像和分子理解的多模态数据分析和生成等。

ICML 2025 大模型深度思考新范式：交替「推理-擦除」解决所有可计算问题

2025年5月15日23时作者机器之心

在 ICML，NeurIPS，ICLR 等顶级会议上发表过论文。
本文提出一个
交替
「推理 – 擦

ICLR 2025 Oral｜差分注意力机制引领变革，DIFF Transformer攻克长序列建模难题

2025年4月28日23时作者机器之心

建模能力为语言理解与生成带来了前所未有的突破。
然而，随着模型规模的不断扩大和应用场景的日益复杂，传

大模型微调数据生成工具Easy Dataset及KBLaM知识注入框架评析

2025年3月21日14时作者老刘说NLP

知识图谱融合大模型的思路。
也就是Easy Dataset大模型微调数据生成工具的三个问题以及大模型

DiffRhythm：10秒生成超燃歌曲，这款AI音乐模型凭啥让音乐创作门槛降为零？

2025年3月11日14时作者小兵的AI视界

问世，宛如一把神奇钥匙，打开了音乐创作高效与便捷的全新大门。今天，
我们将深度聚焦一款在业内备受瞩目

CVPR 2025｜MambaOut：在视觉任务中，我们真的需要 Mamba 吗？

2025年3月10日23时作者极市干货

类中有效地超过了视觉 Mamba 模型
>>
加入极市CV技术交流群，走在计算机视觉的最前沿
本文目

带你从零开始实现一个稀疏专家混合语言模型（MoE模型）

2025年2月25日8时作者 NLP工程化

Hugging Face博客介绍了如何从零实现稀疏专家混合语言模型（MoE），通过解析代码详解自注意力机制、专家模块等组件。