跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

极市干货

ICML 2025 Oral|北大&腾讯优图破解AI生成图像检测泛化难题

2025年7月15日23时 作者 极市干货

一种基于正交子空间分解的新方法,有效解决了 AI 生成图像检测中的泛化难题,显著提升了检测模型的泛化

分类 学术 标签 AI生成图像检测、 DeepFake人脸检测、 大模型微调、 正交子空间分解、 跨域泛化、 通用AI生图生成检测 发表评论

CVPR’25|纯卷积实现用于图像生成扩散模型?DiC:重新思考扩散模型中的 3×3 卷积

2025年7月15日23时 作者 极市干货

最简单但是最快的模块,来实现基于纯卷积的扩散模型。
>>
加入极市CV技术交流群,走在计算机视觉的最

分类 学术 标签 DDPM、 Flux、 PixArt-Σ、 Scalable Diffusion Models、 Transformer、 清华智能计算实验室 发表评论

ACM MM2025 Oral RemoteSAM:轻量统一的遥感视觉模型

2025年7月14日23时 作者 极市干货

提出了一种轻量级的遥感视觉模型RemoteSAM,通过大规模数据集RemoteSAM-270K和统一架构实现了多种视觉任务。显著提升了效率和性能。

分类 学术 标签 270K样本、 RemoteSAM、 东南大学、 河海大学、 遥感视觉模型、 香港科技大学 发表评论

ICML’25|刷新无监督异常检测上限!CostFilter-AD:首个即插即用的代价滤波for异常检测范式

2025年7月14日23时 作者 极市干货

CostFilter-AD
,首次引
入“匹配代价滤波”范式用于无监督异常检测,通过构建匹配代价体并

分类 学术 标签 CostFilter-AD、 UAD框架、 代价体滤波、 复杂问题解决、 工业数据集、 类别自适应损失 发表评论

无Tokenizer时代真要来了?Mamba作者再发颠覆性论文,挑战Transformer

2025年7月14日8时 作者 极市干货

et的新型分层网络,它通过动态分块机制取代了传统的Tokenization过程,实现了真正端到端的语

分类 学术 标签 H-Net、 动态分块模块、 困惑度、 扩展性、 端到端优化、 鲁棒性 发表评论

ImageNet FID 从14干掉到4!ARFlow:自回归嵌入流式图像生成,混合线性注意力破解长程依赖难题

2025年7月13日23时 作者 极市干货

模引入流模型,借助“因果有序噪声序列”与“chunk‑wise 混合线性注意力”,在ImageNet

分类 学术 标签 Gated Linear Attention Transformer (GLAT)、 参考资源、 扩散模型、 技术细节、 模型原理、 深入解释 发表评论

谈谈AWS GB200实例, 顺便谈谈各种自研NPU的困境

2025年7月12日8时 作者 极市干货

于OCI的经营风险进行了一些分析,  正好这几天AWS GB200上线, 因此从AWS的视角再来谈谈

分类 学术 标签 AWS、 GB200、 MFP、 NVLink Switch、 冗余设计、 弹性售卖逻辑 发表评论

CVPR’25 Highlight|开源!无需结构改动与重训练,SURGEON实现轻量级测试时自适应

2025年7月11日23时 作者 极市干货

并开源了
SURGEON
,一种面向移动端的内存自适应的完全测试时域自适应方法。该方法通过动态激活稀

分类 学术 标签 SURGEON、 应用场景拓展、 数据集有效性验证、 理论分析与解释、 用户界面、 网络架构适应性 发表评论

ICCV 2025 Ross3D:让多模态大模型真正“看懂”三维世界!

2025年7月11日23时 作者 极市干货

在ICCV 2025上,作者提出了Ross3D方法,通过重构式视觉指令微调和3D感知自监督实现了超越其他模型的出色表现。

分类 学术 标签 FLUX-VAE、 ICCV2025、 Ross3D、 SOTA、 多模态理解、 王淏辰 发表评论

【CUDA编程】关于矩阵乘加操作的四个指令(ldmatrix、mma、stmatrix、movmatrix)详解

2025年7月11日16时 作者 极市干货

rix)详解
写在前面‌
:在 GPU Tensor Core 的编程实践中,笔者此前通过矩阵乘法优

分类 学术 标签 CUDA、 cuSgemm、 ldmatrix、 mma、 movmatrix、 stmatrix 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面3 页面4 页面5 … 页面40 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×