跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

极市干货

诚邀参加 青岛AICC”用昇腾玩转DeepSeek、Qwen开发实战”集训营活动

2025年3月21日23时 作者 极市干货

多模态大模型深入解读专栏介绍,涵盖Transformer系列、LVM模型及扩散模型等内容。

分类 学术 标签 多模态大模型、 应用领域、 技术专栏、 极市平台、 架构、 训练过程 发表评论

13年后,AlexNet源代码终于公开:带注释的原版

2025年3月21日23时 作者 极市干货

AlexNet源代码现已公开,该模型在2012年ImageNet挑战赛中获胜,并对计算机视觉领域产生了深远影响。

分类 学术 标签 AI 历史、 AlexNet、 ImageNet、 Jeff Dean、 Thomas Wolf、 神经网络 发表评论

AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025

2025年3月19日23时 作者 极市干货

沿研究中一窥复制 Manus 的启示。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
Man

分类 学术 标签 Qwen、 Trunk Attention、 上下文长度扩展、 林俊旸、 生成能力、 通义千问 发表评论

CVPR 2025 满分论文|清华提出TSP3D:基于语言引导空间剪枝的高效3D视觉Grounding

2025年3月19日23时 作者 极市干货

名为 TSP3D 的高效 3D 视觉定位框架,通过语言引导的空间剪枝和多层稀疏卷积架构,实现了高精度

分类 学术 标签 3DVG、 CBA、 GitHub、 RGB-D、 ScanRefer、 TGP 发表评论

自回归模型还能这么玩?kaiming团队:我们真的不需要矢量量化|自回归视觉生成模型系列解读

2025年3月19日23时 作者 极市干货

不是必需的。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
本文目录
1 MAR:不使用 V

分类 学术 标签 Diffusion Loss、 FID、 IS、 Mar 结构、 MATE、 MLP 去噪网络 发表评论

CVPR 2025 清华提出MambaIRv2:图像复原超强SOTA模型

2025年3月18日23时 作者 极市干货

com/p/9375585949
编辑丨极市平台
极市导读
本文提出了 MambaIRv2,一种用于

分类 学术 标签 Attentive State-space Equation、 MambaIRv2、 Semantic Guided Neighboring、 参数调整、 视觉效果优化、 长距离衰减问题 发表评论

结合代码聊聊FlashAttentionV3前向过程的原理

2025年3月18日23时 作者 极市干货

绍了FlashAttentionV3(FA3)的前向过程原理,结合代码分析了其数学公式和工程实现的细

分类 学术 标签 Cutlass库、 Flash Attention、 Reduce SplitK、 局部优化、 性能提升、 数值稳定性 发表评论

尝试基于小模型(0.5B)复现DeepSeek-R1的思维链

2025年3月18日23时 作者 极市干货

认识这个过程,而不是严谨地对每一个剖析细节,因此基本没有公式推导,但一些必要的符号是避免不了的;
第

分类 学术 标签 GRPOTrainer、 GSM8K、 SFTTrainer、 加载数据、 思维链计数、 正确答案奖励 发表评论

迁移视觉基础模型实现可泛化的机器人操作能力

2025年3月17日23时 作者 极市干货

zhihu.com/p/29826500937
编辑丨极市平台
极市导读
本文提出了一种新的机器人操

分类 学术 标签 Franka机械臂、 TPM范式、 多模态大模型、 数据效率、 泛化能力、 轻量化跟踪分割模块 发表评论

破解LoRA融合密码!无需训练夺得SOTA!K-LoRA巧用Top-K策略,让风格与主体完美融合

2025年3月17日23时 作者 极市干货

-LoRA是一种无需额外训练的LoRA融合方法,通过Top-K选择机制和缩放因子,能有效融合独立训练

分类 学术 标签 K-LoRA、 Key-Lora、 消融分析、 用户评估、 精确对象微调、 风格与主题融合 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面18 页面19 页面20 … 页面39 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 电影级视频大作,阿里万相2.2开源发布
  • 智谱GLM-4.5一手实测
  • 国家育儿补贴方案公布,每孩每年3600元!
  • WAIC 2025现场直击|国产AI算力逆风起飞,多种技术路径大突围
  • 字节跳动刚把自己招牌AI Agent开源了,可商用、超6000颗星

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×