让文档更“聪明”!通义实验室ViDoRAG:开启视觉文档智能处理新纪元!

ViDoRAG 是一款专注于视觉文档的开源 RAG 系统,由阿里巴巴通义实验室联合中科大、上海交大推出。它通过多模态混合检索和多智能体迭代推理解决传统 RAG 方法在处理复杂视觉文档时的信息关联性不足和推理能力有限等问题。

从文件到块: 提高 Hugging Face 存储效率

Hugging Face 使用基于 Git LFS 的存储方案在 GitHub Hub 上存储模型、数据集和 Spaces。Xet 团队提出了一个创新的解决方案——基于内容的分块 (CDC),通过只传输变化的数据块来提升存储效率和迭代速度,目前该技术已应用于多个仓库,并实现了数据去重。

HealthGPT:浙大与阿里打造医学视觉语言大模型,智能医疗新突破,看病更方便!

HealthGPT是浙江大学、电子科技大学和阿里巴巴等联合开发的医学视觉语言模型,它通过异构低秩适应、分层问答和多模态融合技术,在医学图像分析、文本理解生成、教育研究及智能健康管理方面表现出色。