极市干货，作者每时AI

迁移视觉基础模型实现可泛化的机器人操作能力

2025年3月17日23时作者极市干货

zhihu.com/p/29826500937
编辑丨极市平台
极市导读
本文提出了一种新的机器人操

2025年3月17日23时作者极市干货

-LoRA是一种无需额外训练的LoRA融合方法，通过Top-K选择机制和缩放因子，能有效融合独立训练

2025年3月17日23时作者极市干货

本文提出了一种基于GoalPoint的端到端生成式方法GoalFlow，通过引入密集的GoalPoint词汇表和高效的扩散模型FlowMatching来生成高质量多模态轨迹，在PDMS上达到了90.3%的最佳性能。

2025年3月16日23时作者极市干货

>>
加入极市CV技术交流群，走在计算机视觉的最前沿
本文目录
1
DyT：取代 Transform

2025年3月16日23时作者极市干货

文章介绍了一种名为DCPT的新图像复原预训练方法，通过退化分类预训练提升模型对不同退化类型的判别能力和高质量图像生成能力，在多种复原任务上取得显著性能提升。

2025年3月15日12时作者极市干货

本文提出了一种轻量化多模态语言模型LLaVA-MoD，通过稀疏专家混合架构和渐进式蒸馏策略，在2B规模下使其性能超过7B大模型8.8%，并在幻觉检测任务中超越教师模型。

2025年3月15日12时作者极市干货

0 blocks) 缩放到 4.8B (60 blocks)，重用小模型的知识。不用从头开始训练模型

2025年3月14日8时作者极市干货

文介绍一个多模态基础模型
M
agma
，通过 Set-of-Mark和 Trace-of-Mark

2025年3月14日8时作者极市干货

上海人工智能实验室发布通用具身智能仿真平台GRUtopia 2.0，通过通用模块化框架、场景资产自动化生成和高效数据采集系统三大革新，实现仅用三行代码定义任务，数据采集效率最高提升20倍。

2025年3月14日8时作者极市干货

n.zhihu.com/p/27397737911
编辑丨极市平台
极市导读
本文提出Pixel2P