跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

极市干货

所有人都可以大规模预训练MAE – 16倍加速!

2025年2月27日23时 作者 极市干货

本文提出了一种基于原型驱动的课程学习框架,用于改进掩码图像建模(MIM)的训练过程。在同样的训练时间下,该方法比标准 MAE 训练快16倍学会 NN 任务的视觉表示。

分类 学术 标签 100 epoch、 Masked Image Modeling (MIM)、 好想吃鸡柳@知乎、 极市平台、 稳定性与效率提升、 课程学习方法 发表评论

「合作咨询」全新展示,期待与您资源共享,开启AI新机遇

2025年2月26日23时 作者 极市干货

文章介绍了极视角科技的内容合作和市场合作渠道,包括内容发布的合作伙伴需求、算法开发与应用、大模型比赛及培训等合作机会,并详细描述了如何对接这些合作机会。

分类 学术 标签 3000家政企客户、 40万开发者、 AI视觉算法、 极视角科技、 深圳、 青岛 发表评论

全新注意力机制!华为诺亚提出ESA:高效选择注意力架构

2025年2月25日23时 作者 极市干货

活高效地选择关键 token 进行注意力计算,大幅度降低了 LLMs 在处理长文本时的计算负担,且在

分类 学术 标签 ESA、 上下文长度扩展、 低维表征、 灵活token选择、 软硬件协同优化、 高效选择性注意力 发表评论

DeepSeek、OpenAI视觉推理到底哪家强?MME-CoT:全新推理Benchmark, 全方位理解LMM的CoT能力

2025年2月25日23时 作者 极市干货

MMLab提出一个新基准测试框架MME-CoT,用于全面评估大型多模态模型在视觉推理任务中的链式思考

分类 学术 标签 Qwen2-VL-72B、 反思过程、 多模态预训练模型、 最佳表现、 极市社区、 长思维链 发表评论

大模型轻量化系列解读 (八):降低 LLM 中因 Activation Spikes 导致的量化误差

2025年2月24日23时 作者 极市干货

型语言模型在后训练量化时面临的激活量化挑战,发现GLU激活中的“激活尖峰”会导致显著的量化误差。为此

分类 学术 标签 Qwen、 动态量化的方案、 大型语言模型、 实验结果、 激活峰值、 静态量化 发表评论

ICLR’25|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2

2025年2月24日23时 作者 极市干货

GaussianV2,能够在快速实现训练和压缩的同时,得到精准的几何结构与逼真的实时渲染体验。
>>

分类 学术 标签 CityGaussianV2、 压缩技术、 并行训练、 泛化能力、 点云真值、 视觉验证 发表评论

扩散模型的推理时优化:分享近期几篇噪声搜索类论文

2025年2月21日23时 作者 极市干货

读
本文介绍了扩散模型在推理时优化方面的最新进展,特别是通过噪声搜索来提升生成图像质量的技术。作者分

分类 学术 标签 ANS、 VAE+Diffusion、 扩散模型、 条件信息流、 生成质量、 自适应噪声选择 发表评论

ICLR 2025|高达 128 倍下采样的 Autoencoder!DC-AE:高效加速高分辨率扩散模型

2025年2月21日23时 作者 极市干货

utoencoder,以加速高分辨率扩散模型
。
>>
加入极市CV技术交流群,走在计算机视觉的最前

分类 学术 标签 DC-AE、 DiT、 技术背景、 研究动机、 自回归扩散模型、 高分辨率图像 发表评论

ICLR 2025|Z-Sampling: 让扩散模型在反思中提升采样

2025年2月20日23时 作者 极市干货

/zhuanlan.zhihu.com/p/24324673054
编辑丨极市平台
极市导读
从理论

分类 学术 标签 LLM推理、 Z-Sampling、 增强契合prompt、 扩散反思、 改进对比度、 语义增益 发表评论

生成理解统一模型解读 (一)|Transfusion:只用一个模型搞定图像生成和理解任务!

2025年2月19日23时 作者 极市干货

sfusion 的多模态模型,它通过结合语言建模(文本)和扩散模型(图像)的训练目标,实现了在单一模

分类 学术 标签 7B参数、 CIDEr分数、 DeepFloyd、 U-Net编码器、 文本生成、 高质量图像 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面23 页面24 页面25 … 页面40 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 12 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×