CVPR 2025 双目匹配新突破!DEFOM-Stereo高效利用单目深度基础模型
本文介绍了一种基于深度基础模型的循环双目匹配框架DEFOM-Stereo,该框架利用Depth Anything V2的强大预训练ViT和随机初始化的CNN构建联合编码器,并设计了用于单目视差初始化、尺度更新的方法。实验结果表明,在仿真域到真实域的零样本泛化上以及在线Benchmark中均表现优异。
本文介绍了一种基于深度基础模型的循环双目匹配框架DEFOM-Stereo,该框架利用Depth Anything V2的强大预训练ViT和随机初始化的CNN构建联合编码器,并设计了用于单目视差初始化、尺度更新的方法。实验结果表明,在仿真域到真实域的零样本泛化上以及在线Benchmark中均表现优异。
PyTorch作为深度学习框架之一受到广泛欢迎,本文推荐了一份包含超200个常用函数的PDF手册,并提供视频学习资料,覆盖神经网络训练和设计等内容。
MLNLP社区是国内外知名的机器学习与自然语言处理社区。《数学能力的重大突破:腾讯发布的DeepMath-103K》介绍了一种包含10.3万道高难度数学题的数据集,旨在提升模型的数学推理能力。
智谱发布GLM-4-32B-0414系列模型,包含基座、推理和沉思模型,支持MIT License,并上线MaaS开放平台。其中推理模型GLM-Z1-32B为国内最快的模型之一,适用于不同场景。通过实测及示例展示了其在问答和功能调用应用中的优势。
DeepSeek V3 SGLang 优化
继续我们的DeepSeek V3与SGLang集成的技术