跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

极市干货

DeepSeek-R1 技术剖析:没有强化学习基础也能看懂的 PPO & GRPO

2025年3月25日23时 作者 极市干货

.zhihu.com/p/22128744640
编辑丨极市平台
极市导读
本文以通俗易懂的方式剖析

分类 学术 标签 GRPO、 PPO、 原理、 应用场景、 强化学习、 数学细节 发表评论

CVPR 2025 加快22倍!Meta提出EdgeTAM:基于SAM 2的高效视频分割模型,性能与速度兼得!

2025年3月21日23时 作者 极市干货

提出了EdgeTAM,这是一个基于SAM 2的高效视频分割模型。EdgeTAM通过引入2D空间感知器

分类 学术 标签 16FPS、 EdgeTAM、 Object Tracking、 实时性、 移动端、 高性能 发表评论

诚邀参加 青岛AICC”用昇腾玩转DeepSeek、Qwen开发实战”集训营活动

2025年3月21日23时 作者 极市干货

多模态大模型深入解读专栏介绍,涵盖Transformer系列、LVM模型及扩散模型等内容。

分类 学术 标签 多模态大模型、 应用领域、 技术专栏、 极市平台、 架构、 训练过程 发表评论

13年后,AlexNet源代码终于公开:带注释的原版

2025年3月21日23时 作者 极市干货

AlexNet源代码现已公开,该模型在2012年ImageNet挑战赛中获胜,并对计算机视觉领域产生了深远影响。

分类 学术 标签 AI 历史、 AlexNet、 ImageNet、 Jeff Dean、 Thomas Wolf、 神经网络 发表评论

AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025

2025年3月19日23时 作者 极市干货

沿研究中一窥复制 Manus 的启示。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
Man

分类 学术 标签 Qwen、 Trunk Attention、 上下文长度扩展、 林俊旸、 生成能力、 通义千问 发表评论

CVPR 2025 满分论文|清华提出TSP3D:基于语言引导空间剪枝的高效3D视觉Grounding

2025年3月19日23时 作者 极市干货

名为 TSP3D 的高效 3D 视觉定位框架,通过语言引导的空间剪枝和多层稀疏卷积架构,实现了高精度

分类 学术 标签 3DVG、 CBA、 GitHub、 RGB-D、 ScanRefer、 TGP 发表评论

自回归模型还能这么玩?kaiming团队:我们真的不需要矢量量化|自回归视觉生成模型系列解读

2025年3月19日23时 作者 极市干货

不是必需的。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
本文目录
1 MAR:不使用 V

分类 学术 标签 Diffusion Loss、 FID、 IS、 Mar 结构、 MATE、 MLP 去噪网络 发表评论

CVPR 2025 清华提出MambaIRv2:图像复原超强SOTA模型

2025年3月18日23时 作者 极市干货

com/p/9375585949
编辑丨极市平台
极市导读
本文提出了 MambaIRv2,一种用于

分类 学术 标签 Attentive State-space Equation、 MambaIRv2、 Semantic Guided Neighboring、 参数调整、 视觉效果优化、 长距离衰减问题 发表评论

结合代码聊聊FlashAttentionV3前向过程的原理

2025年3月18日23时 作者 极市干货

绍了FlashAttentionV3(FA3)的前向过程原理,结合代码分析了其数学公式和工程实现的细

分类 学术 标签 Cutlass库、 Flash Attention、 Reduce SplitK、 局部优化、 性能提升、 数值稳定性 发表评论

尝试基于小模型(0.5B)复现DeepSeek-R1的思维链

2025年3月18日23时 作者 极市干货

认识这个过程,而不是严谨地对每一个剖析细节,因此基本没有公式推导,但一些必要的符号是避免不了的;
第

分类 学术 标签 GRPOTrainer、 GSM8K、 SFTTrainer、 加载数据、 思维链计数、 正确答案奖励 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面19 页面20 页面21 … 页面40 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 12 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×