CVPR 2025 “点级+提示级”双采样黑科技!MICAS重新定义3D点云上下文学习

论文标题:

MICAS: Multi-grained In-Context Adaptive Sampling for 3D Point Cloud Processing

论文链接:

https://arxiv.org/abs/2411.16773

收录会议:

CVPR 2025



研究背景

3D 点云处理(PCP)涉及多种任务,如重建、去噪、配准、分割等,传统做法往往为每个任务设计特定模型,导致模型繁杂、成本高昂。虽然多任务学习(MTL)能缓解模型数量问题,但在任务冲突、参数调优方面仍存在挑战。


近年来兴起的 In-Context Learning(ICL)技术,不依赖参数更新,仅通过 “提示示例” 即可适配多个任务,展示出任务泛化潜力。但将 ICL 用于点云处理时,当前方法面临任务间和任务内的显著敏感性问题。



MICAS 方法:从采样出发,让上下文学习更“懂点云”

本论文提出 MICAS,首个专为点云上下文学习设计的多粒度自适应采样方法,从 “点级” 和 “提示级” 两个维度提升 ICL 在 3D 任务中的稳健性和适应性。

2.1 MICAS 的两大核心模块

Task-Adaptive Point Sampling:利用任务信息,引导点级采样策略,提升模型对任务特征的适配能力。(同一个点云在不同任务中能够产生差异化的采样结果,从而提升任务适应性与表达能力。)


Query-Specific Prompt Sampling:针对每个查询输入,动态选择最优的提示示例,缓解同一任务内提示样本多样性带来的敏感问题。

2.2 MICAS 的具体实现

任务自适应点采样(Task-adaptive Point Sampling)

目标:利用任务相关的信息,优化每个点的采样过程,以提高不同任务间(例如重建、去噪、配准、分割)对点的选择精度。


实现步骤:


  • 提示理解(Prompt Understanding):使用 PointNet 作为编码器,从输入的 prompt 中提取任务特征。通过将输入点云和目标点云的特征进行拼接,生成任务特征。

  • Gumbel 采样(Gumbel Sampling):利用 Gumbel-softmax 实现可微分的采样。这个机制将任务特征和当前点云的特征结合,通过正态化的 sampling weights 生成最终的采样结果。这一过程允许模型在训练期间得到更高的效能。

查询特定提示采样(Query-specific Prompt Sampling)

目标:在相同任务中,针对不同的查询提高提示的相关性,以克服任务内部的各种敏感性。


实现步骤:


  • 伪标签生成:通过 ICL 模型生成预测结果,并评估其与真实值之间的差异,利用这些模型性能作为伪标签。

  • 采样分值计算:对于每个查询点云,根据不同候选提示计算采样分值,选取分值最高的提示作为最终输入。

  • 损失函数:使用 List-wise ranking loss 来优化提示的选择顺序,从而提高模型的整体性能。



实验设置

评估数据集:使用 ShapeNet In-Context Dataset,该数据集包含了多种“输入-目标”点云的对,以便进行全面的任务评估。


评估指标:使用 Chamfer Distance(CD)和 Mean Intersection over Union(mIOU)来衡量不同任务的性能。例如,CD 用于重建、去噪和配准任务,mIOU 用于分割任务。



结果与讨论

性能提升:通过对任务自适应点采样和查询特定提示采样的联合使用,MICAS 在所有被评估任务中均显著超越现有技术,特别是在部件分割任务中,性能相较于前作提升了 4.1%。


严谨性与可靠性:进行了一系列对比实验和消融研究,验证了 MICAS 在不同场景下的鲁棒性,同时展示了各组件在整体性能提升中的协调作用。


复杂度管理:在模型训练过程中,通过分步骤训练来降低复杂度,使得模型既能有效学习任务特征,又可轻松适应不同的提示。



模型训练和推理可视化



实验结果对比可视化

▲ 重建任务的采样结果对比

▲ 去噪任务的采样结果对比

▲ 配准任务的采样结果对比

▲ 分割任务的采样结果对比


(文:PaperWeekly)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往