学术归档 - 第2页共283页

汇总下最近关于 GPT-5 的信息（泄露版）

2025年8月5日23时作者极市干货

PT-5，到底啥时候上线？
>>
加入极市CV技术交流群，走在计算机视觉的最前沿
你有没有这种感觉？

CVPR’25｜一步推理高质量图像！用于蒸馏单步文生图扩散模型的时间无关统一编码器架构

2025年8月5日23时作者极市干货

本文提出时间无关统一编码器Loopfree，通过1步Encoder和4步Decoder实现单步推理的多步生成性能。克服了扩散模型所需几十步推理的问题，提高效率的同时保持高质量结果。

KDD 2025 图也能变token！STAG首提“软量化”，打通GNN与LLM鸿沟

2025年8月5日23时作者 PaperWeekly

uted Graphs），一个创新的自监督框架，通过量化技术将图的结构信息直接转换为离散 token

ICCV 2025 打造首个多模态视觉匹配数据集与评测基准，填补MLLM多模态视频匹配能力评测的空白

2025年8月5日23时作者极市干货

推出首个多模态视觉匹配基准 MMVMBench，系统揭示现有大模型在“识别同一个物体”任务中的能力短

Attention总跑偏？人大×清华联合提出LeaF：剪掉干扰Token，让模型学会主动聚焦

2025年8月5日23时作者 PaperWeekly

因果关键特征，从而提升推理准确性与泛化能力。
论文标题：
Learning to Focus: Ca

尝试终结Attention Sink起因的讨论

2025年8月5日23时作者极市干货

文章提出Transformer中的Attention Sink现象源于模型需要Context Aware的Identity Layer，即注意力块需在某些情况下保持恒等变换。该假设通过首个token的value接近0、深层解码更明显、非归一化注意力和门控机制消除sink等多个实验证据支持，并解释了这一现象的原因。