学术
ICML 2025 Spotlight 用傅里叶分解探讨图像对抗扰动,代码已开源
本文提出了一种基于傅里叶分解的扩散模型对抗净化方法,通过保留低频信息来有效去除图像中的对抗扰动,同时保持图像的语义内容和结构信息。
从 VLM 到 VLA,智驾距离跨过「L2.9999」还有多远?
本周解读汽车智能化领域两则热点事件:一是关于L2.999级别的智驾宣传争议及L3级别自动驾驶的责任归属问题;二是分析端到端技术在自动驾驶领域的前景及其面临的瓶颈。
最新!2025 中国 ESI 大学排名(496 所)
MLNLP社区是国内外知名的机器学习与自然语言处理社区,专注于促进学术界、产业界和爱好者的交流合作。最新ESI数据显示中国在全球科研领域占据重要地位。
ICML 2025 Spotlight|南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架,准确率提高20%
模型(MLLMs)在视觉问答、推理以及 OCR 等任务上取得了显著的成功。然而,早期的 MLLMs