极市干货
连续Token助力文本生成图像迈向新高度!Kaiming团队提出Fluid:MS-COCO上实现6.16 FID
比基于离散 token 的模型实现更好的视觉质量。
>>
加入极市CV技术交流群,走在计算机视觉的最
AI编程相关开源数据集资源汇总
Stack Overflow QA Pairs、CodeSearchNet、CodeContests、HumanEval、BigCode Benchmark等数据集汇总,涵盖Python和SQL问题代码对、GitHub代码搜索数据集、机器学习编程数据集等多种类型。
CVPR 2025|突破边界:3D视觉分割的创新之路
COB-GS通过联合优化语义和视觉信息,显著提高了3D分割精度及对不准确掩模的鲁棒性。该方法在保持高视觉质量的同时产生清晰边界,适用于现实世界的复杂场景。
1比特KV量化,10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
读
在InternVL-2.5上实现10倍吞吐量提升,模型性能几乎无损失。
>>
加入极市CV技术交
CVPR 2025|超强异常检测新方法!INP-Former 从单张图像中提取正常模式
清华大学和华中科技大学的研究团队提出了一种新型异常检测方法INP-Former,通过从单张测试图像中动态提取内在正常原型(INPs),并利用这些INPs指导图像重建,实现了卓越的性能和强大的泛化能力。