学术归档 - 第83页共283页 - 每时AI

ICML 2025｜如何凭「自动补全」实现100K生成3×加速？

2025年5月18日16时作者机器之心

随着 GPT-o3, DeepSeek R1 等具备
「超级上下文窗口
」能力的大模型持续刷新业界

ICML 2025 Spotlight 用傅里叶分解探讨图像对抗扰动，代码已开源

2025年5月18日16时作者机器之心

本文提出了一种基于傅里叶分解的扩散模型对抗净化方法，通过保留低频信息来有效去除图像中的对抗扰动，同时保持图像的语义内容和结构信息。

刚刚！北大校友Lilian Weng最新博客来了：Why We Think

2025年5月18日16时作者机器之心

最近，北大校友、前 OpenAI 应用 AI 研究负责人 Lilian Weng 更新了一篇长长长长

解决小LLM 6类幻觉的实用指南

2025年5月18日14时作者机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

从 VLM 到 VLA，智驾距离跨过「L2.9999」还有多远？

2025年5月18日11时作者机器之心

本周解读汽车智能化领域两则热点事件：一是关于L2.999级别的智驾宣传争议及L3级别自动驾驶的责任归属问题；二是分析端到端技术在自动驾驶领域的前景及其面临的瓶颈。

CVPR 2025 SketchVideo让手绘动起来，视频生成进入线稿时代

2025年5月17日16时作者机器之心

重要研究内容，在影视制作、短视频合成和虚拟仿真等方面都有应用价值。现有的商用和开源的视频生成模型，都

图像分词器造反了！华为 Selftok：自回归内核完美统一扩散模型，触发像素自主推理

2025年5月17日16时作者机器之心

GPT-3 到 GPT-4o，「next-token prediction」以简单粗暴的因果建模横扫

最新！2025 中国 ESI 大学排名（496 所）

2025年5月17日14时作者机器学习算法与自然语言处理

MLNLP社区是国内外知名的机器学习与自然语言处理社区，专注于促进学术界、产业界和爱好者的交流合作。最新ESI数据显示中国在全球科研领域占据重要地位。

ICML 2025 细粒度图文对齐突破！360发布全新一代图文跨模态模型FG-CLIP

2025年5月17日8时作者 PaperWeekly

自 20 年 OpenAI 发布第一代图文跨模态模型 CLIP 以来已经过去了 5 年的时间。
第一

ICML 2025 Spotlight｜南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架，准确率提高20%

2025年5月17日8时作者机器之心

模型（MLLMs）在视觉问答、推理以及 OCR 等任务上取得了显著的成功。然而，早期的 MLLMs