计算效率归档 - 每时AI

无需CUDA代码给H100加速33%-50%，Flash Attention作者新作火了

2025年7月11日16时作者量子位

！
Flash Attention、Mamba作者之一
Tr
i Da
o
的新作火了。
他和两位

ICML 2025 打破残差连接瓶颈，彩云科技&北邮提出MUDDFormer架构让Transformer再进化！

2025年6月27日23时作者机器之心

，彩云科技CEO袁行远。
残差连接（residual connections）自何恺明在 2015

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

2025年6月8日23时作者新智元

enwick树分段，用掩码矩阵，让注意力焕发对数级效率。更厉害的是，它无缝对接线性注意力家族，Mam

专治AI生图「人脸崩坏」，8倍速碾压GPT！新版FLUX.1多方位刷新SOTA

2025年5月30日16时作者新智元

到图像生成的新一代模型，支持文本与图像提示，角色一致性强，速度快达GPT-Image-1的8倍。
用

GPT-4o图像生成的「核燃料」找到了！万字长文拆解潜在变量，网友：原来AI在另一个维度作画

2025年5月6日16时作者机器之心

成功能爆火，掀起了以吉卜力风为代表的广泛讨论，生成式 AI 的热潮再次席卷网络。
而在这股浪潮背后，

深入分析 Llama 4 最新架构

2025年4月22日14时作者机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

英伟达全力发展AI Agent！开源专属大模型，最强AI工厂

2025年3月19日8时作者 AIGC开放社区

英伟达在GTC 2025大会上发布专用于AI Agent的Llama Nemotron模型，并推出了性能更强的Blackwell Ultra AI工厂。

可视化图解MOE大模型的7个核心问题：专家、路由、负载均衡及其用于视觉模态

2025年3月2日19时作者老刘说NLP

，可视化图解moe讲的挺不错，转载过来并做翻译，当作记录，值得收藏慢慢看。
原文在：https://