极市干货
注意力计算减少99.5%,端侧文生图扩散模型成功范式!CLEAR:类卷积线性扩散Transformer
↑ 点击
蓝字
关注极市平台
作者丨科技猛兽
编辑丨极市平台
极市导读
本文介绍了一种名为CLEAR
AAAI’25开源 SUTrack:简单的模型,统一全部单目标跟踪任务!
SUTrack提出了一种简单而统一的单目标跟踪框架,整合了基于RGB、RGB-Depth、RGB-Thermal、RGB-Event和RGB-Language的五个任务,显著降低了研究复杂性,并在多个基准测试中取得了优异性能。
参数减少99.5%,媲美全精度FLUX!字节跳动等发布首个1.58-bit FLUX量化模型
通过1.58-bit FLUX量化模型,显著降低了存储需求和推理内存,同时保持与全精度FLUX相当的性能,在文本生成图像基准测试中表现出色。
AAAI 2025 SparseViT:参数高效的稀疏化视觉Transformer
四川大学吕建成团队与澳门大学合作提出SparseViT,这是一种针对图像篡改检测的稀疏化视觉Transformer。通过稀疏自注意力机制和可学习的多尺度监督机制,实现了对非语义特征的自适应提取,并在多个基准数据集上展现了卓越性能。