跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

极市干货

CVPR 2025 满分论文|收敛速度提升21倍!VA-VAE:重建 vs. 生成,解决 LDM 的优化困境

2025年5月6日23时 作者 极市干货

256 生成上实现了最佳 (SOTA) 性能,FID得分为1.35,同时在短短64个epoch内就达

分类 学术 标签 VF Loss、 关键概念、 扩散模型、 收敛速度、 方法论、 监督信号 发表评论

Diffusion Policy: 将扩散模型加噪-去噪的看家本领用于生成机器人动作啦!

2025年5月6日23时 作者 极市干货

器人视觉运动策略学习方法
Diffusion Policy,
通过将机器人策略表示为条件去噪扩散过程

分类 学术 标签 DDPM、 flow matching、 保持一致性、 多步决策、 抖动问题、 训练样本复用率 发表评论

CVPR 2025 北大提出SLAM3R:基于单目视频的实时密集3D场景重建

2025年4月28日23时 作者 极市干货

交流群,走在计算机视觉的最前沿
北京大学陈宝权团队和香港大学等高校及业界机构联合推出实时三维重建系统

分类 学术 标签 7-Scenes、 Replica数据集、 SLAM3R、 实时性能、 轻量化设计、 重建精度 发表评论

100个GPU卡时、100T算法数据集等,济南免费AI大礼包领取步骤来了!

2025年4月28日23时 作者 极市干货

关注极市平台公众号,获取多模态大模型解读专栏、Transformer系列等技术综述文章。

分类 学术 标签 93、 Dingding、 LVM (Large Visual Multimodal)、 人工智能应用、 多模态大模型、 阿里巴巴达摩院 发表评论

只需 0.5B 参数,全面覆盖预训练+SFT + RL!极简自回归视觉生成框架SimpleAR

2025年4月28日23时 作者 极市干货

的极简自回归视觉生成框架。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
本文目录
1 Si

分类 学术 标签 INT8计算、 MLM预训练、 Transformer架构、 ViT模型、 多任务学习、 模型剪枝 发表评论

北航联合小红书发布大模型翻译最新研究成果,重塑社交生活化翻译新范式!

2025年4月28日8时 作者 极市干货

合发布大模型翻译研究成果 RedTrans,通过双模型回译采样和强化学习偏好优化等创新方法,解决了社

分类 学术 标签 刘子岩、 吕欣泽、 曹绍升、 王岳、 赵飞、 郭宏成 发表评论

五一出行看科技,高速巡检无人机 AI 算法开启智慧新篇

2025年4月28日8时 作者 极市干货

五一期间,传统高速公路巡检存在盲区、识别受限等问题。智慧交通引入无人机进行巡检,通过AI算法实现动态监测、精准识别及应急响应等功能,提升高速公路管理效率。

分类 学术 标签 AI视觉技术、 中国铁塔梧州市分公司、 无人机、 智慧交通、 极视角、 车牌识别 发表评论

港大与字节提出TokenBridge:离散和连续token优点我都要!|自回归视觉生成模型解读系列

2025年4月25日23时 作者 极市干货

模简单的优点,又可以保持连续 token 的强表示能力。
>>
加入极市CV技术交流群,走在计算机视

分类 学术 标签 FID分数、 ImageNet-256、 后训练量化、 生成质量、 维度自回归、 视觉生成 发表评论

2W8000字深度剖析25种RAG变体:全网最全~没有之一

2025年4月24日23时 作者 极市干货

5 种 RAG 变体。 从基本的标准 RAG 到 CRAT 和 Graph RAG 等高级框架 —

分类 学术 标签 CRAT、 Graph RAG、 双语知识图谱、 命名实体识别、 因果增强反射翻译、 因果推理验证 发表评论

如何教会AI像人类一样“慢思考”?阿里&浙大联合提出CMMCoT:多图像理解能力大升级

2025年4月24日23时 作者 极市干货

阿里巴巴与浙江大学联合提出CMMCoT框架,融合多模态推理链与记忆增强机制,提升复杂多图像理解任务的跨图像推理和可解释性能力。

分类 学术 标签 260K数据集、 CMMCoT-7B、 Qwen2-VL、 RIFREM模块、 浙江大学、 阿里巴巴集团 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面12 页面13 页面14 … 页面39 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • AI教父杰弗里·辛顿现身上海参加WAIC 2025,多位人工智能大咖签署“上海共识”
  • 阶跃星辰发布新一代基础大模型Step3
  • 宇树科技发布第三款人形机器人UnitreeR1
  • 大举投资AI究竟是不是“智商税”?
  • WAIC财经下午茶,解码产业变革新引擎

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×