跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

学术

ICML 2025|如何凭「自动补全」实现100K生成3×加速?

2025年5月18日16时 作者 机器之心

随着 GPT-o3, DeepSeek R1 等具备
「超级上下文窗口
」 能力的大模型持续刷新业界

分类 学术、 资讯 标签 Llama3.1-8B、 TOKENSWIFT、 上下文惩罚、 全量缓存、 加速比、 动态KV管理 发表评论

ICML 2025 Spotlight 用傅里叶分解探讨图像对抗扰动,代码已开源

2025年5月18日16时 作者 机器之心

本文提出了一种基于傅里叶分解的扩散模型对抗净化方法,通过保留低频信息来有效去除图像中的对抗扰动,同时保持图像的语义内容和结构信息。

分类 学术、 资讯 标签 傅里叶分解、 净化策略、 对抗扰动、 扩散模型、 标准准确率、 频域角度 发表评论

刚刚!北大校友Lilian Weng最新博客来了:Why We Think

2025年5月18日16时 作者 机器之心

最近,北大校友、前 OpenAI 应用 AI 研究负责人 Lilian Weng 更新了一篇长长长长

分类 学术、 资讯 标签 多模态任务、 批判性思考、 数据高效训练、 注意力机制、 测试时计算、 激励模型 发表评论

解决小LLM 6类幻觉的实用指南

2025年5月18日14时 作者 机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进

分类 学术 标签 上下文混淆的解决方案、 你的总结、 小参数大模型、 指针/复制机制、 时间错误的解决方法、 自然语言推理(NLI) 发表评论

从 VLM 到 VLA,智驾距离跨过「L2.9999」还有多远?

2025年5月18日11时 作者 机器之心

本周解读汽车智能化领域两则热点事件:一是关于L2.999级别的智驾宣传争议及L3级别自动驾驶的责任归属问题;二是分析端到端技术在自动驾驶领域的前景及其面临的瓶颈。

分类 学术、 资讯 标签 L3级别、 中国自动驾驶、 冯兴亚、 安全投入、 广汽集团、 智能驾驶 发表评论

CVPR 2025 SketchVideo让手绘动起来,视频生成进入线稿时代

2025年5月17日16时 作者 机器之心

重要研究内容,在影视制作、短视频合成和虚拟仿真等方面都有应用价值。现有的商用和开源的视频生成模型,都

分类 学术、 资讯 标签 CVPR2025、 SketchVideo、 关键帧、 手绘线稿、 扩散模型、 视频生成 发表评论

图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

2025年5月17日16时 作者 机器之心

GPT-3 到 GPT-4o,「next-token prediction」以简单粗暴的因果建模横扫

分类 学术、 资讯 标签 AR tokens、 GenEval、 ImageNet、 Tokenizer、 强化学习、 预训练 发表评论

最新!2025 中国 ESI 大学排名(496 所)

2025年5月17日14时 作者 机器学习算法与自然语言处理

MLNLP社区是国内外知名的机器学习与自然语言处理社区,专注于促进学术界、产业界和爱好者的交流合作。最新ESI数据显示中国在全球科研领域占据重要地位。

分类 学术 标签 ESI(Essential Science Indicators)、 MLNLP社区、 中国科学院大学、 文章发表量、 文章被引次数、 清华大学 发表评论

ICML 2025  细粒度图文对齐突破!360发布全新一代图文跨模态模型FG-CLIP

2025年5月17日8时 作者 PaperWeekly

自 20 年 OpenAI 发布第一代图文跨模态模型 CLIP 以来已经过去了 5 年的时间。
第一

分类 大模型、 学术 标签 FG-CLIP、 多模态融合、 文本生成、 视觉理解、 长/短标题、 难样本处理 发表评论

ICML 2025 Spotlight|南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架,准确率提高20%

2025年5月17日8时 作者 机器之心

模型(MLLMs)在视觉问答、推理以及 OCR 等任务上取得了显著的成功。然而,早期的 MLLMs

分类 学术、 资讯 标签 4K、 RAP、 Retrieval-Augmented Perception、 Transformer、 计算机视觉、 高分辨率图像 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面82 页面83 页面84 … 页面283 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×