如何教会AI像人类一样“慢思考”?阿里&浙大联合提出CMMCoT:多图像理解能力大升级 下午11时 2025/04/24 作者 极市干货 阿里巴巴与浙江大学联合提出CMMCoT框架,融合多模态推理链与记忆增强机制,提升复杂多图像理解任务的跨图像推理和可解释性能力。
再看大模型幻觉排行、检测工具及多模态RAG技术范式总结 下午2时 2025/04/21 作者 老刘说NLP 实现范式,也有多模态RAG中的embedding和rank模型进展 ,可以看看。 另外, 关于幻觉问
LoRA 微调 Qwen2-VL-2B:轻松提升性能,解锁 GPU 极限! 下午2时 2025/01/30 作者 AI技术研习社 上一篇文章我们探讨了如何使用自定义数据集进行模型训练,这次我将重点介绍如何使用 LoRA 微调 Qw
用微调、量化与推断,玩转 Qwen2-VL多模态大模型自定义OCR数据! 下午2时 2025/01/25 作者 AI技术研习社 最近,我尝试对 Qwen2-VL-2B 进行微调。这是一款强大的多模态大语言模型,既能处理文本,又能