4 月 2025 - 第21页共242页

ICLR 2025 Oral｜差分注意力机制引领变革，DIFF Transformer攻克长序列建模难题

2025年4月28日23时作者机器之心

建模能力为语言理解与生成带来了前所未有的突破。
然而，随着模型规模的不断扩大和应用场景的日益复杂，传

2025年4月28日23时作者极市干货

关注极市平台公众号，获取多模态大模型解读专栏、Transformer系列等技术综述文章。

2025年4月28日23时作者极市干货

的极简自回归视觉生成框架。
>>
加入极市CV技术交流群，走在计算机视觉的最前沿
本文目录
1 Si

2025年4月28日23时作者 AI寒武纪

谷歌内部分享揭秘Gemini预训练背后逻辑与挑战，提出优化模型大小、数据量及推理效率的新方法。强调硬件感知优化、蒸馏技术应用以及引入更多维度的低成本研究机遇。

2025年4月28日23时作者机器之心

北大联合人工智能研究院等推出全新物理评测基准PHYBench，包含500道高质量物理题目，旨在评估大模型在物理感知与推理方面的表现，并通过创新的EED评分机制揭示前沿模型与人类专家之间的差距。

2025年4月28日16时作者机器之心

dependent Researcher 耿鹤嘉。通讯作者为上海人工智能实验室青年科学家白磊和牛津大

2025年4月28日16时作者机器之心

清华大学计算机系郑凯文与德州大学奥斯汀分校何冠德合作的论文提出扩散桥隐式模型(DBIM)，通过引入方差控制参数ρ，显著提升了扩散桥模型(DDBM)在图像翻译和修复任务上的生成质量。

2025年4月28日16时作者机器之心

化学习、智能体、computer-use、A2A…… 对没有技术背景的普通用户来说，这些名词和技术概