Morphik:开源多模态检索增强生成工具,助力AI应用开发

Morphik 是一款开源的多模态检索增强生成工具,专为处理高技术性和视觉内容丰富的文档而设计。它通过 ColPali 技术支持文本、PDF、图片等多种格式文件的搜索和处理,并结合知识图谱构建能力提升检索准确性和相关性。

Pixel Reasoner:滑铁卢等高校联合打造的视觉语言模型,用好奇心驱动的强化学习解锁视觉推理新高度!

Pixel Reasoner 是一款基于像素空间推理增强的视觉语言模型,通过直接操作视觉输入提升对视觉细节的捕捉能力。它结合指令调优和好奇心驱动的强化学习,在多个视觉推理基准测试中表现出色。